Descubriendo nuestro ADN a través de los datos y la nube de Microsoft

Descubriendo nuestro ADN a través de los datos y la nube de Microsoft

¿Quiénes fueron nuestros antepasados? ¿Qué especies de humanos vivieron antes que nosotros? ¿Cuánto de su revuelto legado genético sigue presente en nuestro ADN? ¿Y qué significa esto para la salud y el bienestar de las personas hoy en día?

Desde antes de la época de Charles Darwin, generaciones de científicos han tratado de esclarecer los orígenes de la humanidad, desenterrando y estudiando fósiles. Ahora, una nueva generación de investigadores está buscando las piezas que faltan en el rompecabezas con más claridad y velocidad que nunca, y no solo con picos y palas.

En la actualidad, el big data y el cloud computing han llevado a un equipo de científicos internacionales a realizar un descubrimiento sorprendente: entre nuestros antepasados había dos grupos de homínidos prehistóricos  desconocidos con anterioridad.

Estos primeros humanos, conocidos colectivamente como denisovanos, desaparecieron hace unos 30.000 años, pero no antes de vencer a sus rivales más conocidos por muchos milenios, los neandertales. Y, al igual que los neandertales, coexistieron y se entrecruzaron con nosotros, dejando una herencia genética que se ha transmitido en nuestro ADN hasta el día de hoy.

Estos hallazgos no se basan en investigación sobre restos fósiles, sino en el estudio de la sangre de unas 300 personas que viven hoy en día en islas que se extienden a través de Indonesia, Nueva Guinea y en el Pacífico Suroeste, una porción del planeta donde, hasta ahora, se habían llevado a cabo escasas investigaciones genéticas.

Al igual que los neandertales, los denisovanos coexistieron y se entrecruzaron con nosotros, dejando una herencia genética que se ha transmitido en nuestro ADN hasta el día de hoy
Descubriendo nuestro ADN a través de los datos y la nube de Microsoft

Una réplica de un neandertal macho en el Museo de Historia Natural de Londres.

Las muestras fueron recogidas de forma voluntaria y sometidas a secuenciación genómica, un conjunto de técnicas que permiten identificar las alteraciones del ADN mediante el análisis simultáneo de genes completos. La investigación obtuvo un gran volumen de datos tras más de dos años de modelado y análisis en la nube.

La investigación fue exhaustiva y los resultados fueron inesperados: se encontró que las muestras contenían material genético arcaico de denisovanos nunca antes identificados y en cantidades significativas, particularmente en personas de Nueva Guinea.

Anteriormente, los científicos sólo conocían un tipo de denisovano, a partir de fragmentos óseos encontrados en 2010 en una cueva en una región montañosa de Siberia. Pero esta nueva variedad de denisovano, que se encuentra a miles de kilómetros de distancia entre la población del sudeste asiático, estaba claramente separada.

“Identificamos dos nuevos grupos. Así que ahora sabemos de tres tipos de denisovanos”, dice el profesor Murray Cox de la Universidad de Massey en Nueva Zelanda, quien fue autor de los hallazgos publicados el año pasado en la revista científica Cell.

“Todos son muy diferentes de los neandertales y muy diferentes entre sí. Lo que encontramos significa que los orígenes de la civilización moderna son mucho más diversos y complejos de lo que cualquiera de nosotros había imaginado antes”.

Descubriendo nuestro ADN a través de los datos y la nube de Microsoft

Se realizaron muestreos voluntarios de ADN en las islas que se extienden a lo largo de Indonesia, Nueva Guinea y en el Pacífico sudoccidental.

Además de ampliar nuestra comprensión sobre cómo evolucionamos, el trabajo del equipo demuestra la rapidez con la que los procesos científicos se están transformando con la adopción de nuevas tecnologías.

“Soy biólogo informático. Desarrollo los programas, el código, los algoritmos y las estadísticas para acceder al conjunto de datos y extraer la información que necesitamos para responder preguntas”, señala Cox.

 “La biología ha cambiado. Solía tratarse de pequeñas cantidades de datos en el laboratorio que proporcionaban información lentamente. Pero eso se ha transformado radicalmente en los últimos 10-15 años.”

“Ahora tenemos tecnologías de secuenciación de alto rendimiento que nos proporcionan información muy rápida sobre el ADN. Además, necesitamos una tecnología de la información potente para manejar todos esos datos. Hace más o menos una década, habríamos pasado el 90% de nuestro tiempo en el laboratorio, con líquidos en pequeños tubos de ensayo. Pero con la secuenciación automatizada (genoma), ahora pasamos un uno o dos por ciento de nuestro tiempo en el laboratorio trabajando con muestras y casi todo lo demás se hace sentado frente a un ordenador”.

“Procesar tantos datos puede ser aburrido y laborioso. Azure nos permite dedicar nuestro tiempo a desarrollar nuestra investigación.” – Prof. Murray Cox

Estos descubrimientos sobre los denisovanos se basan en modelos estadísticos creados por Cox y su equipo y ejecutados en Microsoft Azure, lo que resultó ser un factor clave en el éxito de su proyecto. Massey, a diferencia de muchas otras universidades, no tiene su propia instalación informática on-premises para llevar a cabo investigaciones basadas en big data.

“Son ordenadores grandes y caros, pero su capacidad es limitada. Quieren usarlos muchas personas a la vez y eso significa que es muy difícil estimar el tiempo que te va a llevar el proceso en el momento en el que lo necesitas. Tienes que hacer cola”, explica Cox.

En este caso, el equipo se decidió por la nube de Microsoft. “Azure se adapta a la perfección a nuestras necesidades. Es escalable y flexible. Nos da la libertad de trabajar al ritmo que necesitamos para obtener respuestas”.

La ciencia se mueve rápido

Cox estima que, si el equipo hubiera utilizado una instalación de TI interna en lugar de la nube su trabajo podría haber tardado seis meses, un año o más en completarse.

“Es difícil de decir, pero en realidad podría no haberse completado nunca. Esto se debe a que la cantidad de tiempo de proceso que necesitábamos habría significado que alguien llegara antes a las respuestas y publicara antes que nosotros. La ciencia se mueve rápido y las preguntas habrían sido abordadas por otros si no hubiéramos llegado allí a la velocidad que necesitábamos”.

Las empresas y las administraciones utilizan habitualmente el potencial de la nube para seleccionar, analizar y aprovechar montañas de big data de manera rápida, segura y flexible. Cox dice que el cloud computing aporta los mismos beneficios al laboratorio. “Procesar tantos datos puede ser aburrido y laborioso. Azure nos permite dedicar nuestro tiempo a desarrollar nuestra investigación”.

Las nuevas tecnologías y soluciones que operan en la nube y aprovechan la Inteligencia Artificial y el machine learning garantizan un incremento en el ritmo de la investigación. Asimismo, la capacidad de procesar muchos datos rápidamente puede abrir nuevos caminos para la investigación científica, como lo hizo para Cox y su equipo.

“Los orígenes de la civilización moderna son mucho más diversos y complejos de lo que cualquiera de nosotros había imaginado antes”

Descubriendo nuestro ADN a través de los datos y la nube de Microsoft

Una madre y su hijo en Nueva Bretaña, una isla de Nueva Guinea.

Originalmente, empezaron a estudiar las variantes genéticas relacionadas con las enfermedades que se encuentran en las islas del sudeste asiático, ya que ayudan en el desarrollo de tratamientos mejor orientados a los millones de personas que viven allí. La búsqueda de homínidos arcaicos comenzó sólo después de que los primeros datos apuntaran al equipo en esa dirección.

Ahora, con los hallazgos publicados, el objetivo original de la investigación médica continúa, apunta el Dr. Pradiptajati Kusuma, Investigador Principal del Instituto Eijkman de Biología Molecular en Yakarta, Indonesia.

“El valor de los datos generados nos ha abierto los ojos sobre lo poco que hemos aprendido hasta la fecha sobre de la diversidad de nuestras poblaciones. Hemos publicado resultados interesantes sobre la misteriosa introgresión de los denisovanos en todo el archipiélago, pero esto solo es un comienzo”.

Kusuma, que es más conocido como Pai, dice que el equipo ahora se centra en profundizar en los datos para averiguar cómo los atributos genéticos pueden afectar el impacto de los medicamentos, la resistencia a los parásitos y la incidencia de enfermedades no transmisibles.

Mientras tanto, siguen recogiendo muestras de sangre de forma voluntaria, a menudo en comunidades remotas con acceso limitado a servicios médicos básicos.

“Cada vez que realizamos nuestros análisis de muestreo, también ofrecemos controles de salud”, explica Pai. Se analiza una serie de indicadores y niveles, incluyendo la presión arterial, grasa corporal, glucosa en la sangre, colesterol, parásitos transmisores de la malaria y mucho más.

Los investigadores recogen muestras de sangre y realizan controles de salud a los miembros del pueblo Punan, en una casa de la aldea en Borneo. Crédito de la foto: Dr. Safarina Malik.

Cox afirma que los hallazgos de la disparidad de los denisovanos ya están dando sus frutos, por ejemplo, en los casos de algunos pacientes isleños del Pacífico que sufren de trastornos autoinmunes.

“Hemos observado que el gen que causa estos trastornos proviene de los denisovanos y, desde que nos dimos cuenta de eso, la comunidad médica ha estado desarrollando nuevos tratamientos porque saben cuáles son las variantes genéticas”.

 “Así que, cuando hablamos de neandertales y denisovanos, podría ser fácil pensar que todo esto es cosa del pasado. Pero en realidad, las variantes genéticas que la gente lleva hoy de estos homínidos arcaicos nos están afectando directamente.”

“Es una historia muy presente. Y vive en nuestras células.”

Imagen principal: Un retrato de una mujer de Papua Nueva Guinea. Los investigadores dicen que los nuevos conocimientos sobre los tipos de ADN de las personas de la región ayudarán en el desarrollo de tratamientos médicos específicos. Imagen de Gerrit Bril de Pixabay.

Sobre el autor