Les scientifiques disent qu’ils ont enfin séquencé l’ensemble du génome humain. Oui, tout ça.

En juin 2000, les scientifiques ont annoncé que la première ébauche de la séquence du génome humain était terminée. Générer la séquence était un exploit technique – qui a permis aux scientifiques de commencer à lire le plan génétique de l’humanité – mais il manquait encore environ 8 % du génome.

Aujourd’hui, un consortium international d’environ 100 scientifiques, surnommé le Consortium télomère à télomère (T2T), affirme avoir enfin assemblé le génome humain dans son intégralité. Si leur travail, qui a été publié le 27 mai sur le site Web pré-imprimé bioRxiv, résiste à l’examen par les pairs, cela pourrait changer l’avenir de la médecine. Au fur et à mesure que les chercheurs se familiarisent avec le code génétique de l’humanité, ils peuvent, par exemple, fabriquer des médicaments plus précis et plus efficaces, y compris le type de traitement axé sur les gènes qui a alimenté les premiers vaccins efficaces contre le COVID-19.

Le premier projet a conduit à un boom de la technologie, comme CRISPR, et de la thérapeutique, mais les scientifiques n’ont pas réalisé à quel point le projet était incomplet à l’époque, explique Karen Miga, Ph.D., chercheuse en génomique à l’Université de Californie, Santa Cruz, et membre du Consortium T2T.

La séquence de 2000 était le produit du Human Genome Project (HGP) et de la société privée Celera Genomics. HGP a affirmé qu’il avait cartographié l’ensemble du génome humain à l’époque, mais était prudent dans la façon dont il définissait son succès : hautement contigu (avec les seules lacunes restantes correspondant à des régions dont la séquence ne peut pas être résolue de manière fiable avec la technologie actuelle).

La « technologie actuelle » fait beaucoup de travail ici. À l’époque, HGP utilisait une technologie appelée chromosome artificiel bactérien (BAC), où les scientifiques utilisaient une bactérie pour cloner chaque morceau du génome, puis les étudiaient en petits groupes. Une “bibliothèque BAC” complète est constituée d’environ 20 000 bactéries soigneusement préparées contenant des gènes clonés. Mais ce processus BAC manque intrinsèquement certaines parties du génome entier.

Les humains ont 46 chromosomes, en 23 paires, qui représentent des dizaines de milliers de gènes individuels. Chaque gène est constitué de paires de bases constituées d’adénine (A), de thymine (T), de guanine (G) et de cytosine (C). Il y a des milliards de ces paires de bases dans le génome humain. Il s’avère que les paires de bases dans les 8 pour cent intacts de l’ébauche du génome de 2000 sont constituées de très nombreux modèles répétés qui étaient trop difficiles à étudier à l’aide de BAC ou de méthodes similaires.

Pour la dernière séquence, T2T s’est tourné vers Pacific Biosciences (PacBio) basée en Californie et Oxford Nanopore Technologies basée au Royaume-Uni. PacBio utilise un système appelé HiFi, où les paires de bases sont circularisées (formées en cercle) et lues à plusieurs reprises pour garantir la précision. Le système n’a que quelques années et représente un grand pas en avant en termes de longueur et de précision pour ces séquences plus longues. Oxford Nanopore, quant à lui, presse des brins de paires de bases à travers un nanopore microscopique – une seule molécule à la fois – où un courant électrique les zappe afin d’observer de quel type de molécule il s’agit. En zapping chaque molécule, les scientifiques peuvent identifier le brin complet.

La quantité de terrain couverte par T2T est stupéfiante. « Au cours des 20 dernières années, nous avons connu une révolution génomique où nous avons commencé à mettre des fonctions, base par base, à travers le génome », explique Miga. “Maintenant, nous allons présenter à la communauté 200 millions de bases, qui n’ont pas été examinées auparavant, pour commencer à attribuer des fonctions et commencer à comprendre comment fonctionne notre génome.”

Il y a encore du travail à faire. Un hic, c’est que les deux projets ont étudié des cellules qui n’avaient que 23 chromosomes au lieu des 46 complets. C’est parce qu’ils utilisent des cellules dérivées du système reproducteur, où les ovules et les spermatozoïdes portent chacun la moitié d’une charge chromosomique complète. La cellule utilisée dans les dernières recherches provient d’une taupe hydatiforme, une sorte de croissance reproductive qui représente une union extrêmement précoce et non viable entre un spermatozoïde et un ovule dépourvu de noyau.

Choisir ce type de cellule, qui a été conservé et cultivé comme lignée cellulaire utilisée à des fins de recherche, réduit de moitié l’énorme travail de séquençage, mais, dans ce cas, il ne porte que des informations génétiques du chromosome du père. Une fois l’étude passée par le processus d’examen par les pairs, PacBio et Oxford tenteront de séquencer un génome comprenant des informations génétiques des deux parents.

Autre hic, le matériel à partir duquel ce génome a été séquencé ne représente que l’information génétique d’une seule personne. Le consortium a fait appel à une autre équipe, le Human Pagenome Reference Consortium, et prévoit de séquencer les génomes de personnes de différentes régions du monde et de créer un éventail ethniquement diversifié de matériel génétique à étudier.