Chile busca preservar los idiomas originales y extenderlo a América Latina y el Caribe con Latam-GPT, el primer modelo de idioma desarrollado en la región.
Latam-GPT es un modelo de idioma de gran tamaño (LLM) que agrega la participación de 32 países y cuya primera versión experimental se presentará en septiembre de este año.
Es parte de un proyecto de colaboración coordinado del Centro Nacional de Inteligencia Artificial (Cenia) de Chile y promovido conjuntamente por más de 32 instituciones desde México hasta la Zona Austral de Chile.
Al rescate de los idiomas originales que están desapareciendo
El director de Cenia, Álvaro Soto, explicó que la mayoría de los modelos de IA han sido entrenados con datos generados en inglés y en contexto del norte global.
Él enfatizó que Latam-GPT busca corregir esta realidad y construir una IA con perspectiva latinoamericanacapacitado con textos, documentos y datos de la región.
Se profundizó que este motor latinoamericano también busca preservar los idiomas nativos, para incorporar dialectos locales.
En Chile lo han hecho con los idiomas Rapa Nui, el Rapa Nui Polynessic y el Mapudungún, de la etnia vernácula Mapuche.
En Rapa Nui, a 3.700 kilómetros de la parte continental de Chile, considerado el punto más remoto del mundo, o el ombligo del mundo, como dicen sus habitantes, por estar en el medio del Pacífico, la Cenia trabajó con la Universidad Católica, la comunidad local y la Academia de Lenguas Rapa Nui Nui ‘ūmaŋa Hatu Re’o.
“Ya lanzamos ‘Translator Rapa Nui’. Encontrarán el traductor que hoy permite a Rapa Nui y viceversa traducir del español y fue una experiencia muy hermosa”, explicó sobre el trabajo de campo que hicieron en la isla en diciembre pasado.
“Llevamos este idioma a un modelo computacional, por lo que lo preservamos hasta la eternidad y ese era el objetivo (…) De esta manera lo mantiene vivo, y allí tenemos un proyecto ahora; en los sitios gubernamentales queremos usar el traductor para que la gente de Rapa Nui pueda hacer todos sus procedimientos”, dijo Soto.
También explicó que con la comunidad Mapuche, las personas originales con la mayor población en Chile (79.8 por ciento de los 2,185,729 habitantes indígenas, según los últimos datos de 2017) han llevado a cabo un trabajo similar.
“Ha sido un poco más difícil porque la comunidad no es una, pero hay varios y tienes que estar de acuerdo con todos”, y dijo que esta herramienta también está lista, pero que se lanzará pronto.

Por su parte, el Ministro de Ciencia, Tecnología, Conocimiento e Innovación de Chile, Aisén Etcheverry, ejemplificó que en las conversaciones con Ecuador, uno de los 12 países que participa en este proyecto a nivel de gobierno o instituciones, también expresó su interés en incorporar idiomas originales que “están desapareciendo” en esta nación.
“Cuando decimos que el modelo tiene que reflejar la idiosincrasia, la cultura también significa pasar mucho tiempo, por ejemplo, la construcción de esa relación con las comunidades para que lo sientan como propio y no como una apropiación cultural”, dijo sobre el trabajo con las comunidades.
El funcionario dijo, aludiendo a las palabras pasadas del presidente chileno, Gabriel Buric, que el país sudamericano tiene el deseo y la capacidad de “Poder liderar una agenda de inteligencia artificial en América Latina que fuera en beneficio de las personas y que tenía responsabilidad y ética como vectores de desarrollo. “
“En el caso de Chile estamos comenzando con los municipiosPero también, ¿por qué no, soñar con escuelas, hospitales, servicios públicos en general que tienen acceso a un modelo de idioma que no es importado, pero que es creado por nosotros y que refleja no solo nuestra lengua, sino también nuestra cultura e idiosincrasia “, dijo Etcheverry?

Cómo funciona Latam GPT, el LLM creado en Chile
Latam-GPT será un modelo abierto accesible para las universidades, el gobierno y las comunidades y busca fortalecer las capacidades de la IA locales, desde la capacitación técnica hasta la toma de decisiones estratégicas, para evitar la dependencia de las plataformas extranjeras, detalladas del gobierno local.
Su capacitación se lleva a cabo en una infraestructura de supercomputo regional, incluidos los centros de la Universidad de Tarapacá, en el norte del país, y ha recopilado y curado datos en español y portugués.
Latam-GPT se lanzará en una primera versión abierta en septiembre A continuación, con un modelo con aproximadamente 70,000 millones de palabras en español, portugués e inglés.