La secuencia del genoma humano original, publicada en 2001, omitió alrededor del ocho por ciento del ADN
Una secuencia completa del genoma humano finalmente ha sido publicada por un consorcio internacional de científicos. El nuevo genoma de referencia llena muchos vacíos que quedaron en borradores anteriores, especialmente en los centrómeros en el medio de los cromosomas y las duplicaciones a gran escala.
El trabajo se describe en una serie de artículos publicados el 1 de abril en Science por el Consorcio Telómero a Telómero (T2T). Varios investigadores de la Universidad de California, Davis contribuyeron a los estudios, incluida Megan Dennis, profesora asistente de bioquímica y medicina molecular en la Escuela de Medicina y el Instituto MIND de la UC Davis, con los estudiantes de posgrado en Genética Integrativa y Genómica Daniela Soto y Colin Shew, así como con Charles Langley, profesor distinguido de evolución y ecología en la Facultad de Ciencias Biológicas de UC Davis, junto con su hija Sasha Langley, científica del proyecto en la UC Berkeley.
La secuencia del genoma humano original, publicada en 2001, omitió alrededor del ocho por ciento del ADN, dijo Dennis. Las áreas que quedaron fuera incluían duplicaciones casi idénticas que contenían genes funcionales, así como centrómeros y telómeros en el medio y en la punta de los cromosomas, respectivamente. Estas áreas contienen largas tiradas de secuencias repetidas.
"Estas son regiones importantes pero difíciles de secuenciar", dijo Dennis.
Secuenciar un genoma es como cortar un libro en fragmentos de texto y luego tratar de reconstruir el libro juntándolos de nuevo. Los tramos de texto que contienen muchas palabras y frases comunes o repetidas serían más difíciles de colocar en su lugar correcto que las piezas de texto más únicas.
La tecnología de secuenciación de ADN anterior solo podía leer series de secuencias relativamente cortas.
"Un salto importante en la tecnología ha sido la secuenciación de lectura larga", dijo Dennis. Los secuenciadores de nueva generación pueden decodificar piezas mucho más largas, hasta un millón de pares de bases o "letras" de ADN. Eso significa que los fragmentos son mucho más grandes y más fáciles de volver a ensamblar en la secuencia original.
"Es un cambio de juego", dijo Dennis.
Los investigadores de la UC Davis contribuyeron al proyecto realizando parte de la secuenciación de lectura larga con máquinas en el Genome Center y analizando variantes y secuencias duplicadas.
El nuevo genoma de referencia procede de una única muestra humana, aunque no exactamente de una persona. El ADN procedía de una línea celular derivada de un conjunto de células llamado mola hidatiforme. Estas se forman cuando un óvulo en el útero pierde su propio genoma pero es fertilizado por un espermatozoide. La célula resultante termina con dos copias idénticas de cada cromosoma, a diferencia de la mayoría de las células humanas, que tienen dos copias ligeramente diferentes. A pesar de su extraño origen, no hay nada que sugiera algo fuera de lo común con el genoma de la línea celular, dijo Dennis.
El esperma provino de una persona de ascendencia europea. En contraste, el genoma de referencia humano original fue ensamblado de varias personas, creando algunos errores y artefactos.
Imagen: La profesora asistente Megan Dennis (centro) con el estudiante graduado Colin Shew (izquierda) y Daniela Soto afuera del Centro del Genoma de UC Davis. El laboratorio de Dennis, con el profesor Charles Langley de la Facultad de Ciencias Biológicas, participó en un consorcio dirigido por los NIH que completó la secuenciación del genoma humano. (Karin Higgins/UC Davis)
Explorando el centrómero
Alrededor del 90 por ciento de la nueva secuencia en realidad proviene de los centrómeros de los cromosomas, dijo Langley. Estructuralmente distintas y que contienen largos tramos de ADN repetitivo, estas regiones son notoriamente difíciles de estudiar.
"Solíamos decir que advertirías a los jóvenes genetistas que no se aventuraran en el centrómero porque nunca saldrías", dijo Langley.
Pero estos días los centrómeros son un tema candente en biología. Aquí es donde se une la maquinaria que separa los cromosomas emparejados durante la meiosis (formación de espermatozoides y óvulos), un paso fundamental en la herencia. Contiene grandes cantidades de heterocromatina, o áreas donde el ADN y las proteínas parecen estar más condensadas y compactas.
Los genetistas conocen desde hace décadas la heterocromatina, vista como manchas oscuras en los cromosomas. El pensamiento reciente sugiere que la heterocromatina juega un importante papel en cómo se activan y desactivan los genes al cambiar partes del ADN a una fase diferente del resto del cromosoma, como gotas de aceite en el agua. Esto crearía efectivamente compartimentos en el núcleo donde genes específicos podrían activarse o desactivarse.
Otro misterio de los centrómeros es cómo y por qué se forman constantemente en el mismo lugar, porque no existe un código genético específico para que lo hagan. Se determinan "epigenéticamente", o fuera del genoma. Básicamente, tus centrómeros están donde están porque ahí es donde estaban en el espermatozoide y el óvulo del que fuiste concebido.
Los Langley y sus coautores pudieron comparar las secuencias de centrómeros del nuevo genoma de referencia con otras secuencias publicadas, proporcionando evidencia de que los centrómeros humanos, de hecho, pueden moverse un poco. Esto se ha encontrado en otras especies animales.
"Ahora podremos comprender mejor cómo suceden estas cosas", dijo Langley.
Aplicaciones
Tener la secuencia original del genoma humano ha sido una poderosa herramienta de descubrimiento en las ciencias biomédicas durante los últimos 20 años. La nueva referencia ayudará a los investigadores a comprender mejor la variación, especialmente en aquellas áreas que antes no estaban bien cubiertas o con errores y artefactos, dijo Dennis.
"Ya se está utilizando para volver a analizar los genomas recopilados por el Proyecto 1000 Genomas, descubriendo y verificando miles de nuevas variantes", dijo. El Proyecto 1000 Genomas es una colaboración internacional para crear un catálogo de la variación genética humana.
Esas nuevas variantes genéticas confirmadas pueden, por ejemplo, asociarse con estados de enfermedad y resultados clínicos utilizando datos de secuenciación de pacientes, como individuos autistas, dijo Dennis.
El Consorcio T2T incluye 114 científicos en 33 instituciones y está copresidido por Adam Phillippy, NHGRI y Karen Miga, UC Santa Cruz.
Referencias en "A complete reference genome improves analysis of human genetic variation"