La inteligencia artificial (IA) es un motor capaz de transformar sectores tan diversos como la nueva economía de la lengua, la educación y la cultura. Sin embargo, para que esta revolución tecnológica sea beneficiosa para todos, es esencial que las múltiples lenguas y culturas en el mundo sean correctamente representadas y fortalecidas en el ámbito digital. Aquí es donde entra en juego el proyecto ILENIA (Impulso de las Lenguas en Inteligencia Artificial), una ambiciosa iniciativa que busca integrar las lenguas cooficiales de España en la vanguardia de las tecnologías inteligentes. Por ende, en este artículo exploraremos los objetivos y la estructura del proyecto ILENIA, los subproyectos dedicados a cada lengua cooficial y la importancia del multilingüismo en el desarrollo tecnológico y económico.

¿Hacia dónde se conduce el proyecto ILENIA?

El proyecto ILENIA (Impulso de las Lenguas en Inteligencia Artificial) tiene como fin la creación de un ecosistema digital inclusivo y multilingüe en España, posicionando al país como líder en la integración de la inteligencia artificial con las lenguas cooficiales. Con una inversión de 7 millones de euros, ILENIA busca desarrollar recursos lingüísticos avanzados que abarquen el catalán, gallego, euskera y valenciano. Estos recursos incluyen corpus multimodales, modelos de lenguaje neuronal, motores de traducción y reconocedores del habla en diferentes lenguas. ILENIA se articula en cuatro proyectos específicos enmarca dentro del proyecto estratégico del PRTR (Plan de Recuperación, Transformación y Resilencia): AINA para el catalán, NÓS para el gallego, GAITU para el euskera y VIVES para el valenciano. Cada uno de estos subproyectos tiene el objetivo de generar herramientas tecnológicas que faciliten el uso de estas lenguas oficiales en aplicaciones de inteligencia artificial, como asistentes de voz, traductores automáticos y agentes conversacionales.

¿Cuántos subproyectos componen a ILENIA?

El proyecto ILENIA (Impulso de las Lenguas en Inteligencia Artificial) se estructura en torno a cuatro subproyectos principales, cada uno enfocado en una lengua cooficial de España:

AINA

Este subproyecto, coordinado por el Consorcio Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), se centra en la creación de corpus y modelos informáticos para la lengua catalana. Con un presupuesto de 3 millones de euros, AINA busca facilitar la integración del catalán en aplicaciones basadas en inteligencia artificial, como asistentes de voz, buscadores de Internet y traductores automáticos.

NÓS

Bajo la coordinación de la Universidad de Santiago de Compostela, NÓS recibe una financiación de 2 millones de euros. Su objetivo es desarrollar los recursos digitales y lingüísticos necesarios para promover el uso del gallego en tecnologías inteligentes, incluyendo asistentes de voz y agentes conversacionales.

GAITU

Coordinado por la Universidad del País Vasco a través del Centro Vasco de Tecnología de la Lengua (HiTZ), GAITU también cuenta con 2 millones de euros de financiación. Este subproyecto pretende desarrollar servicios lingüísticos básicos y transversales en euskera para su utilización en la administración pública y otros sectores estratégicos.

VIVES

Con 500,000 euros de financiación, la Universidad de Alicante, a través del Centro de Inteligencia Digital (CENID), lidera el proyecto VIVES. Su enfoque principal es la creación de corpus masivos de voz y texto en valenciano, utilizando tanto datos de la administración pública como de la participación ciudadana.

¿De qué forma se coordina este proyecto?

La coordinación general está a cargo del Consorcio Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), que lidera el subproyecto AINA y supervisa el progreso del proyecto en su conjunto de las lenguas de España. La coordinación se centra en garantizar la sinergia entre los subproyectos de las cuatro lenguas, optimizar los recursos y asegurar la integración de las lenguas cooficiales en las aplicaciones de inteligencia artificial que den respuestas a las necesidades de la sociedad. Los PERTE (Proyectos Estratégicos para la Recuperación y Transformación Económica) son un nuevo instrumento de transformación digital con colaboración público privada en los que colaboran las distintas administraciones públicas, empresas y centros de investigación. Su objetivo es impulsar grandes iniciativas que contribuyan claramente a la transformación de la nueva economía digital de España.

¿Cuáles han sido los avances de ILENIA?

El proyecto de inteligencia artificial ILENIA ha logrado varios avances significativos desde su inicio, reflejando su impacto en la integración de las lenguas cooficiales en el ámbito de la inteligencia artificial dentro del marco del proyecto de recuperación y transformación económica:

Desarrollo de recursos lingüísticos

ILENIA ha avanzado en la creación de corpus multimodales y modelos de lenguaje para las lenguas cooficiales (catalán, gallego, euskera y valenciano). Estos recursos incluyen datos de texto y de voz esenciales para la formación de sistemas de IA, como asistentes de voz y traductores automáticos.

Modelos multilingües

Se han desarrollado y actualizado modelos de lenguaje neuronal que permiten la inclusión de las lenguas cooficiales en aplicaciones tecnológicas avanzadas. Estos modelos están diseñados para mejorar la precisión y funcionalidad de las herramientas de IA en contextos multilingües.

Publicación de datos

ILENIA ha puesto a disposición de la comunidad investigadora y de desarrolladores los datos y metadatos generados a través de la plataforma Hugging Face. Esto facilita la colaboración y el acceso a recursos lingüísticos para el desarrollo de nuevas aplicaciones, reforzando así la resiliencia de las lenguas.

Incorporación en plataformas

El proyecto ha comenzado a implementar y adaptar módulos y bibliotecas para el catalán, euskera, valenciano y gallego en plataformas de referencia, aumentando la visibilidad y uso de estas lenguas en el ámbito digital.

Importancia del multilingüismo en el desarrollo tecnológico y económico

El multilingüismo desempeña un papel crucial en el desarrollo tecnológico y económico, especialmente. Al integrar múltiples lenguas cooficiales en aplicaciones de IA, ILENIA no solo preserva y promueve la diversidad lingüística, sino que también impulsa la inclusión digital. La adaptación de tecnologías como asistentes de voz y traductores automáticos a diversas lenguas permite una mayor accesibilidad y participación en el mercado global, beneficiando a empresas y administraciones públicas que operan en un entorno multilingüe. Económicamente, el multilingüismo abre nuevas oportunidades de mercado al permitir a las empresas ofrecer servicios personalizados y accesibles en diferentes idiomas. Además, fomenta la innovación al proporcionar datos y modelos lingüísticos más ricos y diversos. En el contexto de ILENIA, esta integración lingüística contribuye a una economía digital más competitiva y equitativa, fortaleciendo la presencia y el impacto de las lenguas cooficiales en el panorama tecnológico.