¿Está la inteligencia artificial preparada para interactuar en lenguas indígenas? Este texto responde a esta pregunta. Foto: LLYC

Resume e infórmame rápido

Escucha este artículo Audio generado con IA de Google 0:00 / 0:00 1 x

El Día Internacional de las Poblaciones Indígenas se celebra todos los 9 de agosto desde hace exactamente 30 años. Es una celebración reconocida por la Asamblea General de las Naciones Unidas (AGNU) y se proclamó por primera vez durante el Decenio Internacional de las Poblaciones Indígenas del Mundo.

Su objetivo es reconocer y conmemorar el avance significativo en la promoción y protección de los derechos de los pueblos indígenas. Sus antecedentes se remontan hasta la primera reunión del Grupo de Trabajo sobre Poblaciones Indígenas en 1982.

Un grupo que fue fundamental para la creación de los Derechos de los Pueblos Indígenas en la Declaración de las Naciones Unidas. Lo que le dio un marco universal a estos derechos y que reconoce su importancia cultural, social, política e histórica.​​

Ahora, este 2025, conmemorando tres décadas del Día Internacional de las Poblaciones Indígenas, la IA generativa aparece como una aliada para preservar y difundir las lenguas indígenas. La firma LLYC lanzó un informe en colaboración con BID Lab y Microsoft en que muestra el estudio de 21 estrategias aplicadas a siete lenguas indígenas para incrementar los datos disponibles y fortalecer su presencia digital.

Lenguas indígenas en Colombia

En el país se hablan 70 lenguas: el español y 69 lenguas maternas, entre ellas 65 indígenas, 2 criollas (el palenquero de San Basilio y el creole de las islas de San Andrés y Providencia), la lengua romaní del pueblo Room–Gitano y la lengua de señas colombiana.

Sin embargo, según la Organización Nacional Indígena de Colombia (ONIC), el 40% de estas lenguas están en peligro de extinción, lo que pone en riesgo saberes ancestrales, ritos culturales y cosmovisiones indígenas.

Es en este punto en el que la aplicación de la inteligencia artificial (IA) generativa contribuye a la preservación de la diversidad lingüística en Colombia. Es por eso que la firma LLYC, en colaboración con BID Lab, el departamento de innovación, el Grupo Banco Interamericano de Desarrollo y Microsoft, lanzó el informe “El desempeño de la inteligencia artificial en el uso de lenguas indígenas americanas”.

¿De qué se trata el informe?

El documento visibiliza la situación actual de las lenguas indígenas y propone una serie de recomendaciones relacionadas con la IA. En total, son 21 estrategias para dar visibilidad y proteger la traducción y voz de siete lenguas indígenas colombianas.

Además, esta herramienta puede ayudar a reducir brechas derivadas del analfabetismo o el monolingüismo en zonas aisladas. Y para eso es importante entrenar un modelo de inteligencia artificial capaz de reconocer y responder a estos dialectos.

En el 54 % de los casos, las preguntas formuladas en estos idiomas reciben respuestas hasta cuatro veces más breves que las generadas en español. Incluso, las respuestas son desviadas hacia referentes occidentales, incluso cuando se le piden referencias indígenas.

¿Qué dicen los autores del estudio?

“Para que la inteligencia artificial sea verdaderamente inclusiva a nivel global, debe comprender y adaptarse a los distintos contextos lingüísticos y culturales. Este estudio representa un punto de partida fundamental para avanzar en la representación de las lenguas indígenas en las tecnologías del futuro”, dijo Adolfo Corujo, CEO de LLYC.

“En Microsoft, nuestro objetivo es poner a las personas primero. Nos comprometemos a abordar las brechas indicadas para lograr dicha meta”, expresó Daniel Korn, director de políticas e innovación en IA para Microsoft.

“Desde BID Lab promovemos el desarrollo de soluciones de inteligencia artificial que respondan a los contextos reales de América Latina y el Caribe. Este estudio nos permite identificar brechas y oportunidades para avanzar hacia tecnologías más accesibles y relevantes para nuestras comunidades”, finalizó César Buenadicha, jefe de la división Ecosystem Building y Acceleration de BID Lab.