SAM (format de fichier)

SAM (format de fichier)
Caractéristiques
Développé par
Type de format
Basé sur
Site web

Le format de cartographie d'alignement de séquence, en anglais sequence alignment map (SAM) est un format texte permettant de stocker des séquences biologiques alignées sur une séquence de référence développé par Heng Li et Bob Handsaker et al[1]. Il est largement utilisé pour stocker des données telles que séquences de nucléotides générées par les technologies de séquençage de nouvelle génération. Le format prend en charge les lectures (en anglais reads) courts et longs (jusqu'à 128 Mbit/s) produit(e)s par différentes plates-formes de séquençage et est utilisé pour conserver des données alignées dans le cadre du Genome Analysis Toolkit (GATK) et au sein du Broad Institute, Wellcome Sanger Institute et du projet 1000 Genomes. Ce format peut contenir des qualités d'appel de base ou base-calling, d'alignement et d'autres données[2],[3].

  1. a et b Li, Handsaker, Wysoker et Fennell, « The Sequence Alignment/Map format and SAMtools », Bioinformatics, vol. 25, no 16,‎ , p. 2078–2079 (ISSN 1367-4803, PMID 19505943, PMCID 2723002, DOI 10.1093/bioinformatics/btp352, lire en ligne)
  2. « EDAM bioinformatics operations, data types, formats, identifiers and topics - SAM - Classes | NCBO BioPortal », purl.bioontology.org (consulté le )
  3. « SAM/BAM Format Specification », samtools.github.io

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne