18 Apr 2018 - 12:56 a. m.

Así es el árbol genealógico de 86 millones de personas

Genetistas, ingenieros de computación y médicos usaron los datos que 86 millones de personas subieron al portal Geni para construir el árbol genealógico más grande que se conoce.

- Redacción Vivir

FamilyHealth
FamilyHealth

El verdadero big data, dicen los científicos, es el genoma humano. Innumerables páginas web han nacido para organizar y re construir los viejos trazos de la civilización como Ancestry.com, MyHeritage y Geni.

Asombrosamente, 130 millones de usuarios han generado billones de perfiles genealógicos, ofreciendo a los científicos una oportunidad de oro: hacer el rastreo genealógico más grande de la historia.

Por eso, investigadoras del New York Genome Center, del Instituto de Investigación Biomédica de Cambridge, del departamento de biología celular de Harvard y otros institutos de investigación, departamentos de epidemiología y centros de computación (incluído el MIT y MyHeritage, en Israel), estudiaron los datos de los perfiles genealógicos que millones de usuarios construyeron en línea en el portal Geni para construir el árbol genealógico de 86 millones de personas.

El artículo fue publicado en Science News y se tituló Crowdsourced genealogies and genomes (algo así como Genomas y genealogías recolectadas colectivamente).

“Las relaciones humanas, tal como lo documentan los árboles genealógicos, pueden dilucidar la heredabilidad de una serie de parámetros médicos y biológicos”, dicen las investigadoras, que usaron los datos para examinar la arquitectura genética de la longevidad humana y los patrones de migración de por lo menos, 20 generaciones.

Según lo ponen las investigadoras, los árboles genealógicos son estructuras gráficas matemáticas que pueden capturar el apareamiento y la paternidad entre los humanos.

Los árboles representan líneas de transmisión para una amplia variedad de factores genéticos, culturales, sociodemográficos y económicos. Pero los árboles genealógicos de gran tamaño (como el que ha levantado el país de Israel en su banco de datos MyHeritage), depende de repositorios locales como iglesias, oficinas, registradurías, etc. Por la misma razón, los datos pueden estar sujetos a estrictas protecciones de uso.

Las investigadoras descargaron de la web Geni los datos de 86 millones de personas que subieron sus perfiles individuales y cargaron árboles genealógicos. El sitio web escanea automáticamente los perfiles para detectar similitudes y crear árboles genealógicos.

“Organizamos los perfiles en gráficos que preservan las relaciones genealógicas entre individuos. La biología dicta que un árbol genealógico debe formar una figura en donde cada individuo tiene un grado de parentesco con otro individuo en que es menor o igual a 2. Sin embargo, el 0.3% de los perfiles residía en topologías biológicas no válidas, es decir, personas adoptadas o con más de dos padres. Depuramos esa información con genetistas expertos y nos quedamos con el resto de información que generó 5.3 millones de árboles familiares distintos, dijo Joanna Kaplanis, genetista del New York Genome Center, e investigadora principal.

El árbol genealógico más grande llegó a incluir 13 millones de individuos que estaban conectados por ascendencia compartida y matrimonio, es decir, un largo linaje de primos hermanos casados.

Las investigadoras exploraron la ubicación geográfica, la longevidad, y los patrones de migración. Ubicaron 16 millones de perfiles en coordenadas geográficas, de modo que encontraron que el 55% de los datos venían del mundo occidental, con un 55% de europeos y 30% de América del Norte.

Para caracterizar la longevidad de cada “linaje”, tomaron en cuenta tanto la conducta como una serie de genética compleja. Se dieron cuenta de que la longevidad (es decir, la esperanza de vida) se heredó entre un 15 al 30%. “Pero reconocemos que hay un sesgo. La longevidad de una persona tiene que ver con su condición socioeconómica, el momento histórico y su conducta, no solo con la genética”, señalan las investigadoras.

Notaron, por ejemplo, que entre la Primera y Segunda Guerra Mundial la esperanza de vida disminuyó notablemente en las siguientes generaciones a la de los soldados que fueron a morir a la guerra.

En cuanto a los patrones de migración, se dieron cuenta de que las mujeres migran más que los hombres, pero en distancias más cortas. También se dieron cuenta de que las distancias entre madre-hijo son menores que entre padre-hijo, y que esta tendencia apareció durante los casi 300 años de análisis que lograron recolectar.

También analizaron la relación y la distancia entre las parejas casadas. La distancia entre apellidos (geográficamente) era de menos de 10 kilómetros antes de la Revolución Industrial (1750), luego se aceleró a más de 100 kilómetros después del comienzo de la Revolución Industrial (1870). Es decir que antes de la Revolución Industrial las relaciones entre casados aún era la de primos hermanos. Determinaron, entre otras, que cada 70 kilómetros la relación genética entre casados, disminuye.

De acuerdo con Science News, esto es una nueva herramienta de investigación a lo largo de la historia de la humanidad, pues los estudios genealógicos abarcan desde la antropología hasta la genética y la medicina moderna. Por ejemplo, siglos de genealógicos islandeses combinaron su propia información familiar con escrituras de los primeros años de esta nación para rastrear los orígenes de sus apellidos.

Este no es el primer árbol genealógico a gran escala que se realiza, pero sí el más grande. El programa de genética DeCode aceleró el proceso para crear la genealogía en línea de 864.000 islandeses. Esto resultó en una página en línea que se llamó Islendingabók, en 2003.

La herramienta ha servido no solo para rastrear linajes y probar “pedigree”. También ha servido a médicos y antropólogos para rastrear enfermedades complejas, rasgos faciales, etc. Otra geneaológia única ha sido creada a partir de registros históricos de la Iglesia Mormona desde 1921. En ese entonces, cientos de miles de voluntarios crearon medio millón de perfiles diarios, muchos conectados a registros de atención médica, lo que permite a los investigadores rastrear los antecedentes médicos comunes. “Un verdadero crowdsurcing”, concluye el estudio.

Síguenos en Google Noticias