Objectifs

La détection de mutations (SNP/INDEL) permet de comparer des séquences proches (ex : génomes/transcriptomes de 2 organismes appartenant à la même espèce) afin de repérer des mutations d'intérêt.

Mapping

Le mapping est un alignement de séquences courtes (typiquement des reads issus de séquençage Illumina) sur une référence au format FASTA. L’étape de mapping permet de réaligner les reads sur la référence pour détecter et localiser les mutations sur le génome.

Exemples d’applications

  • Médicale : recherche de mutations impliquées dans des maladies génétiques, tests de dépistage de certains cancers
  • Pharmaceutique : prédiction de réponse à un traitement
  • Agronomique : sélection de lignées
  • construction de cartes génétiques, études de phylogénie

Outils utilisés

  • Bowtie2 : Réalignement des reads sur la référence
  • Suite logicielle samtools : Filtrage des alignements et détections des mutations

Pré-requis

  • Pour chaque échantillon : données de séquençage au format FASTQ avec une profondeur minimum allant de 30X pour la détection de SNP homozygotes à 50X si on souhaite également détecter les SNP hétérozygotes.
    Il est généralement conseillé de travailler avec une profondeur de 50X : http://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-15-247
  • Séquences de références au format FASTA (transcriptome, génome...). Le génome ou transcriptome de référence peut être généré par un assemblage de novo des reads.

Rendu client

Fichiers de comparaison au format VCF ou CSV.

Délais de réalisation

Paramètres à prendre en compte

  • Taille et nombre de séquences de la référence
  • Nombre d'échantillons.