Initié au début des années 1990, le Human Genome Project (« Projet Génome humain » en français) a permis la publication de la séquence du génome humain en 2003. Cet exercice montre la méthode utilisée pour parvenir à cet exploit scientifique.
Le caryotype humain
Le génome d'un organisme correspond à la séquence nucléotidique portée par l'ADN de ses cellules. Dans un organisme eucaryote diploïde (comme l'humain), le génome est fragmenté : plusieurs molécules d'ADN sont présentes dans le noyau, chacune formant un chromosome linéaire, et chaque chromosome est présent par paire. Le caryotype d'un organisme correspond à la photographie des chromosomes ordonnés par taille d'une cellule en métaphase (chromosomes à deux chromatides).

© Wikimedia Commons
Protocole expérimental simplifié
L'ADN génomique de plusieurs humains a été fragmenté en morceaux de grande taille. Chaque fragment de chromosome a ensuite été séquencé de nombreuses fois et sur de petites portions aléatoires. Les séquences obtenues ont ensuite été assemblées par chevauchement, de manière à reconstruire la séquence complète de chaque fragment de chromosome, puis de chaque chromosome.

Méthode de séquençage
La détermination de la séquence nucléotidique des fragments d'ADN a été obtenue par une version modifiée du séquençage Sanger. Celle-ci permet de répliquer l'ADN in vitro, et d'arrêter aléatoirement la réplication par l'incorporation d'un nucléotide associé à une molécule fluorescente. Chaque type de nucléotide (A, T, C, G) est associé à une couleur, on obtient donc des fragments d'ADN de différentes tailles dont la couleur correspond au dernier nucléotide ajouté.
La séquence d'ADN se lit alors facilement sous la forme d'un chromatogramme, qui représente la succession des pics d'intensité de fluorescence des différents nucléotides. Cette méthode n'est utilisable que sur de petites portions d'ADN.

© Abizar at English Wikipedia, CC BY-SA 3.0, via Wikimedia Commons
Combien y a-t-il de paires de chromosomes chez l'humain ?
Le document 1 montre qu'il existe 23 paires de chromosomes chez l'humain, soit 46 chromosomes au total. Chaque chromosome ayant deux chromatides sur le caryotype, il y a en tout 92 molécules d'ADN visibles. Il existe deux types de chromosomes : les autosomes (chromosomes non sexuels) et les gonosomes (chromosomes sexuels X et Y).
Pourquoi les fragments de chromosomes ne sont-ils pas séquencés directement ?
La méthode de séquençage Sanger utilisée ne fonctionne que sur des fragments d'ADN courts (document 3). Les fragments de chromosomes sont donc trop longs pour que le séquençage réussisse, d'où la nécessité de séquencer de petites portions chaque fois.
Quel est l'intérêt de séquencer un grand nombre de fois et aléatoirement les fragments de chromosomes ?
Ce protocole permet d'augmenter la précision du séquençage car chaque portion du fragment de chromosome est séquencée plusieurs fois : on vérifie ainsi qu'il n'y a pas eu d'erreurs. Cela permet aussi d'être sûr que le séquençage a été effectué sur toute la longueur du fragment.
Quelle est la séquence d'ADN déterminée dans le document 3 ?
Une flèche indique le sens de lecture, de bas en haut, la séquence est donc ATAAAAAACTCA…