Este martes 10 de febrero se lanzó Latam-GPT, el primer Gran Modelo de Lenguaje abierto de la región, diseñado con identidad propia desde y para América Latina y el Caribe. Este proyecto representa un avance relevante para la región al proponer un modelo de Inteligencia Artificial (IA) construido con idiomas, datos y contextos propios de América Latina y el Caribe, desarrollado por talento regional para la región.
El desarrollo del primer Gran Modelo de Lenguaje abierto de la región fue liderado por el Centro Nacional de Inteligencia Artificial (CENIA) y contó con la colaboración de diversos actores regionales. Data Observatory contribuyó a la iniciativa a través de capacidades profesionales, infraestructura en la nube, una red de servidores de alto rendimiento que permitió entrenar el modelo de manera óptima y continua, procesamiento de datos y asesoría estratégica y técnica al equipo de CENIA.
El proyecto contó también con el apoyo del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación de Chile, el Banco de Desarrollo de América Latina y el Caribe (CAF), Amazon Web Services (AWS) y el centro tecnológico Data Observatory, además de la colaboración de diversos Estados de la región y alianzas desde la academia, organismos internacionales, y líderes tecnológicos.
El lanzamiento del hito tecnológico contó con la presencia del Presidente de la República, Gabriel Boric, el ministro de Ciencia, Tecnología, Conocimento e Innovacion, Aldo Valle, el director ejecutivo de Data Observatory, Rodrigo Roa, el director CENIA, Álvaro Soto, el Especialista Principal de Ciudades Inteligentes y Desarrollo Digital del Banco de Desarrollo de América Latina y el Caribe, Marcelo Facchina y el líder de Tecnología de Amazon Web Services para el Cono Sur de América Latina, Rafael Mattje. Al evento asistieron también destacadas autoridades nacionales y regionales, miembros del cuerpo diplomático y diversos representantes del ecosistema tecnológico latinoamericano.
A diferencia de los modelos entrenados principalmente con información en inglés y marcos culturales del Norte Global, Latam-GPT comprende los matices culturales, lingüísticos y los contextos históricos y políticos latinoamericanos. Este modelo, desarrollado por investigadores, científicos y profesionales de la región, posiciona a América Latina no solo como usuaria de tecnología de vanguardia, sino como protagonista en su creación, fortaleciendo la capacidad regional para innovar con identidad propia.
"Eso que se expresa en manifestaciones culturales de esas características también es necesario que, en estos tiempos, tenga una expresión en el lenguaje. Y el lenguaje de hoy día nos guste o no nos guste está muy determinado por la inteligencia artificial. Entonces, no tenemos que temerle, no tenemos que verla sólo como amenaza, tenemos que verla como oportunidad y eso es lo que está haciendo LATAM-GPT hoy día", sostuvo el Presidente Gabriel Boric, quien pudo ver interacciones con el modelo que ilustran cómo el sistema podría operar en el futuro, evidenciando la capacidad de éste para procesar contextos regionales con un nivel de precisión y comprensión que los modelos importados no logran alcanzar.
Por su parte, el ministro de Ciencia, Aldo Valle, señaló: “Este proyecto nace desde la convicción de que la integración regional es la única vía realista para alcanzar soberanía tecnológica con sentido democrático, por eso lo articulamos mediante una gobernanza público-privada inédita, que reúne al Estado, universidades, organismos internacionales y empresas tecnológicas. Es parte de política pública robusta, con una Política Nacional de Inteligencia Artificial y con inversiones concretas en supercómputo, data centers, formación docente y modernización del Estado. Desde Chile lideramos esta iniciativa poniendo esta infraestructura al servicio de la pertinencia cultural, de nuestras lenguas, valores y tradiciones, como una herramienta de innovación para mejorar la calidad de vida de las personas y enfrentar, desde nuestras propias capacidades, los desafíos del siglo XXI”
"Latam-GPT marca un hito en la soberanía digital de América Latina y demuestra que sí podemos ser protagonistas del desarrollo tecnológico. Como Data Observatory nos enorgullece haber aportado nuestra infraestructura en la nube, capacidad de procesamiento de datos y la experiencia de nuestro equipo para operar esta tecnología con eficiencia", comentó por su parte Rodrigo Roa.
Idiomas y datos locales
La construcción de Latam-GPT responde a una brecha histórica en el desarrollo de modelos de lenguaje a nivel global, ya que, según estimaciones basadas en repositorios abiertos como Common Crawl, los datos en español y portugués representan -respectivamente- apenas cerca del 4% y el 2% del total utilizado para entrenar este tipo de sistemas.
Esta subrepresentación implicó que las realidades latinoamericanas no fueran consideradas de manera adecuada ni en el diseño ni en el entrenamiento inicial de gran parte de los modelos disponibles hoy, quedando incorporadas, en muchos casos, a través de ajustes posteriores y mecanismos de corrección, y no como parte constitutiva de su arquitectura.
Frente a este escenario, Latam-GPT fue entrenado desde su origen para comprender las variantes del español y el portugués, así como las historias, memorias e identidades culturales de la región. Esto permitió procesar, generar y analizar idiomas de manera situada y contextualizada, con potencial aplicación en investigación, gestión pública y desarrollo tecnológico.
