Cinco claves del modelo de lenguaje de inteligencia artificial anunciado por Sánchez en el MWC
- El proyecto busca promover el desarrollo tecnológico en España
- "Tendremos un ChatGPT español a partir de verano", apunta Mariona Sanz, del BSC
Dos palabras han copado los titulares, discursos y expositores de la última edición del Mobile World Congress. La inteligencia artificial (IA) ha sido la protagonista absoluta del congreso de tecnología móvil más importante del mundo. Así lo aventuraba ya el discurso de inauguración del presidente del Gobierno, Pedro Sánchez, que anunciaba la creación de un modelo de lenguaje de IA en las lenguas cooficiales de España. ¿Qué implica este anuncio? Estas son las claves para comprenderlo, de la mano de algunos expertos:
El papel de los modelos de lenguaje en la inteligencia artificial
El proyecto presentado por Sánchez cuenta con la colaboración de la Red Española de Supercomputación y el Barcelona Supercomputing Center (BSC-CNS). Mariona Sanz, jefa de Innovación y Desarrollo de Negocio del BSC-CNS, entiende que el Gobierno ha considerado a su centro por su capacidad científica y su “casuística”, puesto que acaban de presentar el MareNostrum 5, con una gran capacidad de computación y eficiencia. La iniciativa cuenta con el apoyo de un consorcio en el que han estado implicados varios centros nacionales.
Luis Alfonso Ureña, presidente de la Sociedad Española para el Procesamiento del Lenguaje Natural, destaca que uno de los objetivos de crear este modelo es “evitar estar condicionados por las big tech”. Explica que ChatGPT funciona como “una caja negra”, por lo que se desconoce “cómo se ha entrenado o si se han violado políticas de derechos de autor”. En los últimos tiempos, el procesamiento del lenguaje natural (PLN) atrae más miradas, algo que, a su juicio, no es de extrañar puesto que “más de la mitad de la IA es el PLN. De hecho, es lo que la ha hecho explotar”.
Los modelos de lenguaje masivos han supuesto una revolución tecnológica, hasta convertirse en la base de las aplicaciones de IA más habituales, como explica Marta Villegas, jefa de la Unidad de Tecnologías del Lenguaje del BSC-CNS. Cristina Aranda, filóloga y experta en IA, añade que la materia prima con la que trabaja la IA son los datos y el 80% de ellos tiene naturaleza lingüística. “En la inteligencia natural el lenguaje es indispensable, pues en la inteligencia artificial también”, afirma.
Un impulso a la industria tecnológica española
Sánchez hizo referencia al impacto de este proyecto en el desarrollo tecnológico de España. Para Elena González-Blanco, jefa de IA para Nativos Digitales de EMEA (Europa, Oriente Medio y Asia) en Microsoft, es “muy buena señal que el Gobierno ponga el foco en estas cosas”. Destaca el caso de Francia, donde el ejecutivo “ha creado un ecosistema en el que la IA pueda desarrollarse y crecer”, lo que ha dado lugar al nacimiento de empresas punteras en el sector, como Mistral AI.
La IA supone un importante foco de inversión. Marta Villegas, del BSC-CNS, insiste en que España no debe depender de la investigación y tecnología de las grandes corporaciones estadounidenses: “tenemos el deber de tener la soberanía tecnológica y de los datos. Se nos abre una oportunidad y una responsabilidad”.
Al ser un modelo abierto, cualquier entidad podrá acceder a él. Las expertas coinciden en que puede posicionar a España como referente internacional. “Para utilizar los modelos privados, las empresas tienen que pagar, en nuestro caso es abierto y eso contribuye a reforzarlo”, explica Mariona Sanz.
La necesidad de un modelo multilingüe y multicultural
El anuncio del presidente incidió en que se trata de un modelo de lenguaje diseñado específicamente para las lenguas del Estado, con la colaboración de la RAE y la Asociación de Academias de la Lengua Española. El corpus, explica la filóloga Cristina Aranda, es la materia prima con la que se entrena la IA de corte lingüístico. Las IA generativas se alimentan de multitud de bases de datos presentes en internet, que, habitualmente, no tienen la calidad necesaria, lo que explica la aparición de errores y sesgos. Existe otra manera de entrenar a la máquina, “bajo una supervisión practicada por profesionales del lenguaje, que aseguran que los corpus estén bien trabajados”. Es sencillo encontrar material cuidado en inglés, pero es escaso en otras lenguas, como el español.
Se cumplirá una demanda de la comunidad de desarrolladores que reclama que estos corpus se abran, de tal manera que sean modificables. Así, será posible ampliar el contenido y diseñar corpus específicos para distintos ámbitos, como las finanzas o el derecho. “Tengo que trabajar con buenos ingredientes para que lo que cocine salga bien”, explica Aranda, que considera que es el camino para que los productos de IA que se generen en las lenguas del Estado sean realmente productivos.
Para Marta Villegas, la importancia de entrenar estos sistemas en cada una de las lenguas es proporcionarles contexto. “ChatGPT entiende el español, incluso el catalán, pero los modelos anglocéntricos están entrenados con un 90% de datos en inglés, así que saben mucho de la SuperBowl pero nada de, por ejemplo, la pelota vasca”, aclara. Considera que restringir el aprendizaje de la máquina a un idioma significa perder mucho conocimiento, mientras que la apuesta por entrenamientos multilingües “es una manera de que el modelo no solo sepa más sobre nuestras lenguas, sino también sobre nuestra cultura e incluso nuestros valores”.
El origen de esta iniciativa se encuentra en el proyecto ILENIA (Impulso de las Lenguas en Inteligencia Artificial), coordinado por el BSC, que ya trabajaba este aspecto con las lenguas cooficiales. El centro estudia desde hace tiempo el desarrollo de modelos de IA en tecnologías del lenguaje. En 2022, presentó MarIA, una familia de modelos de lenguaje masivos en español. Villegas explica que se trataba de encoders (codificadores) y “se utilizan para tareas discriminativas, como clasificar documentos o hacer tareas de análisis de sentimiento”. Con este proyecto, se da el salto a los generativos o decoders (decodificadores).
Inteligencia artificial en la gestión pública: la ciudadanía en el centro
En su discurso, Sánchez mencionó la aplicación de la IA a las políticas públicas, un aspecto algo desconocido, pero cada vez más frecuente. Juan Ignacio Criado es politólogo, experto en IA y director del Lab Innovación, Tecnología y Gestión Pública de la Universidad Autónoma de Madrid. Considera que este anuncio “va en la línea de una IA más plural y diversa, en consonancia con la Estrategia Nacional de Inteligencia Artificial y la normativa europea, que ponen el foco en los derechos de la ciudadanía”. Este modelo se opone a los que predominan en el mercado asiático y norteamericano, por lo que Criado cree que puede “contribuir a una lógica diferente” e insiste en la necesidad de colaboración entre los distintos actores.
Para el politólogo, destaca también su carácter transhispánico. Hace pocos meses, se aprobó la Carta Iberoamericana de la Inteligencia Artificial en la Administración Pública, en la que ha participado como relator. El documento detalla cómo algunos países empiezan a promover la IA dentro del sector público y establece algunas pautas. En un contexto de gobernanza algorítmica, donde cada vez más actividades están mediadas por algoritmos, surgen voces que llaman a los gobiernos a regular para evitar que estos procesos queden en manos de las big tech y sus intereses económicos. Criado defiende que “no se trata solo de regular, sino de aportar liderazgo y una visión de hacia dónde deberíamos encaminarnos”.
A pesar del miedo inicial, los expertos esperan que la IA mejore las administraciones públicas. Criado se refiere a la posibilidad de que los profesionales se liberen de las tareas más desagradables, la promoción de un debate público más informado y la mejora de los análisis de datos, como vía para reaccionar adecuadamente a situaciones de crisis y resolver problemas en sociedades cada vez más complejas. “El hecho de que dispongamos de más información nos puede ayudar a planificar mejor, atender bien las necesidades de la ciudadanía e identificar aquellos ámbitos donde más se necesitan los recursos públicos”, apunta.
Un camino de obstáculos para alcanzar los objetivos
El desarrollo de proyectos como este se enfrenta también a desafíos. La posibilidad de aplicar sesgos, el impacto medioambiental y el potencial de estas herramientas para generar desinformación preocupan a los expertos, aunque se muestran optimistas. Juan Ignacio Criado anima a huir de enfoques deterministas sobre la IA y avisa de que “la tecnología lo que hace es habilitar, pero no es esencialmente bueno ni malo”.
Cristina Aranda encuentra retos tecnológicos, como la dificultad de hallar equipos con suficiente experiencia y conocimiento, lograr que todo el ecosistema trabaje conjuntamente y crear proyectos que realmente impacten. Marta Villegas reconoce también la complejidad de conseguir y procesar los datos suficientes, que todas las lenguas tengan una representación adecuada, diseñar un buen corpus de entrenamiento y contar con la capacidad de computación necesaria. Esto último no es habitual, lo que provoca que todavía falte experimentación y “exista un desconocimiento sobre cuál es la mejor estrategia, los mejores parámetros y las mejores configuraciones”.
Uno de los mayores desafíos será atraer la confianza de la ciudadanía. “Si las personas ven que los sistemas son opacos o no están bien explicados pierden la confianza, lo mismo sucede con los propios empleados públicos que tienen que interactuar con la máquina”, explica Criado. En este sentido, es relevante que el proyecto se desarrolle en código abierto. Para Mariona Sanz, “favorece la transparencia, porque, además de ser abierto el modelo algorítmico, lo son los datos con los que se entrenan y puedes tener una garantía de trazabilidad de todo lo que se utiliza”. Destaca, también, que esto evita problemas de copyright y proporciona garantías legales, porque se construye sobre los principios de la legislación europea sobre IA.
Ya solo queda resolver cuándo se pondrá a disposición del usuario. Desde el Barcelona Supercomputing Center revelan que ya cuentan con datos suficientes y ahora comienza la fase de diseño del modelo. “Tenemos la ventaja de que ya salimos con los deberes hechos, previsiblemente tendremos un ChatGPT español a partir de verano”, anuncia Mariona Sanz.
* Inés Modrón es alumna del Máster en Periodismo Digital: Innovación e Investigación de la Universidad de Valladolid