Así es ALIA, la inteligencia artificial española desarrollada por el Gobierno
- ALIA es el primer modelo de lenguaje de IA en las lenguas del estado abierto y financiado con fondos públicos
- Su desarrollo reduce la dependencia de modelos internacionales y potencia el uso de datos locales
El presidente del Gobierno, Pedro Sánchez, ha aprovechado la clausura del acto 'HispanIA 2040: cómo la inteligencia artificial mejorará nuestro futuro' para anunciar el lanzamiento en abierto para todos los usuarios de ALIA, "el modelo fundacional de inteligencia artificial (IA) en español". Sánchez ya avanzó la intención del Ejecutivo de impulsar el desarrollo de esta familia de modelos de lenguaje de IA en la inauguración de la última edición del Mobile World Congress. El proyecto está liderado por el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), que gestiona el MareNostrum 5, uno de los superordenadores más potentes del mundo, que ha sido fundamental en el entrenamiento del modelo.
ALIA es un gran modelo de lenguaje de inteligencia artificial, entrenado en español, catalán, gallego, valenciano y euskera. El proyecto está completamente financiado con fondos públicos y promete proporcionar un servicio de interés general, pero ¿qué implica para la ciudadanía?
Un modelo de lenguaje abierto y transparente
ALIA se define en su propia web como "la primera infraestructura pública europea, abierta y multilingüe" de inteligencia artificial. Su apertura es precisamente una de las características que diferencian el modelo de otros disponibles en la red. "En los modelos cerrados, la compañía tiene el control en todos los procesos. Puede ser más o menos transparente, pero está supeditado a lo que diga la empresa", explica el cofundador de la Asociación Española de Inteligencia Artificial Responsable y profesor de la Universitat Oberta de Catalunya (UOC), Josep Curto.
Los modelos pueden ser abiertos parcialmente o en su totalidad. Destacan tres elementos clave: el conjunto de datos, el modelo y los pesos. En línea con los principios de la legislación europea en materia de inteligencia artificial, el proyecto presenta un modelo totalmente abierto. En ALIA Kit, los interesados pueden acceder a toda la información, como la metodología, la documentación y los conjuntos de datos de entrenamiento y evaluación, lo que refuerza su transparencia.
Para Curto, una de las grandes ventajas de los modelos abiertos es que permiten a los investigadores identificar sus puntos fuertes y débiles. De esta manera, un mayor número de expertos pueden validarlos y alertar de los problemas, para resolverlos con efectividad. La explicabilidad del sistema es otro de los factores a tener en cuenta. Un mayor acceso a su documentación, facilita la comprensión del modelo.
Para qué se va a poder usar ALIA
Sánchez ha anunciado en su intervención que ya se encuentran a disposición todos los usuarios "los primeros modelos de ALIA". A pesar de que el proyecto se ha presentado como un modelo de lenguaje, es, en realidad, una familia de modelos. Lo que varía de uno a otro, explica Curto, es la cantidad de parámetros con los que se ha entrenado: "Al final, se traduce en su potencia de predicción, si están ayudados por distintos conjuntos de datos y si tienen más o menos complejidad de estructura".
El modelo general se ha entrenado para múltiples usos, pero, para casos específicos, no es suficiente. Es preferible optar por modelos diseñados en concreto para esa situación. Apple Intelligence —la inteligencia artificial de Apple— es un buen ejemplo, cuenta Curto: "Cuando activas la IA no te descargas uno, sino varios modelos pequeños que están optimizados para cada función. Por ejemplo, uno se encarga de borrar a las personas de las imágenes, otro de corregir la redacción". Además, explica, se accede desde distintas interfaces de entrada, es decir, no se presenta una única herramienta capaz de cumplir con todas las demandas del usuario.
Algo similar sucederá con ALIA. El presidente ha señalado que ya "están en marcha los trabajos para aplicarla a dos proyectos piloto". El primero de ellos, se trata de un "chatbot interno, que agilizará el trabajo de la Agencia Tributaria y su atención ciudadana". Por otro lado, se implementará a la medicina de atención primaria, "para un diagnóstico precoz y más preciso de las insuficiencias cardíacas".
Contar con distintos modelos permite adaptar cada uno de ellos a su contexto. "No siempre es necesario utilizar el modelo más grande, dependerá del caso de uso. Uno pequeño está más afinado para el uso específico, se ejecuta más rápido y requiere menos recursos", subraya Curto. El experto recuerda que, si toda la familia está abierta, los interesados podrán descargar cualquiera de los modelos y usarlo dentro de sus sistemas. De este modo, podrán elegir el que más se adecúe a sus necesidades y modificarlo para ajustarlo a su ámbito.
Una IA que habla las cuatro lenguas oficiales
Otro de los elementos definitorios de ALIA es su carácter multilingüe. La familia de modelos soporta todas las lenguas de España, con la colaboración de la Real Academia Española (RAE) y la Asociación de Academias de la Lengua Española. La IA de corte lingüístico se entrena con corpus, que habitualmente proceden de bases de datos disponibles en internet. En ellas, abunda el contenido en inglés, pero escasea en otras lenguas. El entrenamiento en las lenguas cooficiales del estado aporta contexto y riqueza al sistema. "Se trata de que los modelos de lenguaje no tengan que hacer un esfuerzo extra para soportar, por ejemplo, el gallego o el catalán", aclara Curto.
No es la primera iniciativa de este tipo. El Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC) ya ha coordinado el proyecto ILENIA (Impulso de las Lenguas en Inteligencia Artificial), que trabaja también sobre la IA. En 2022, el mismo centro presentó MarIA, una familia de modelos de lenguaje masivos en español. La RAE impulsó también en 2019 el proyecto LEIA (Lengua Española e Inteligencia Artificial), enfocado a proyectos de verificación ortográfica o responder consultas lingüísticas.
"Copilot,
¿me puedes hacer una lista de las tareas pendientes?"
"Tareas pendientes:
Carmen, actualización de la lista de clientes..."
En Repsol, hace un año, pusieron en marcha un piloto
con 600 empleados de diferentes áreas
300 con licencia "copilot",
el asistente de inteligencia artificial
generativa de Microsoft,
y 300, en puestos similares sin él.
Han medido los resultados y...
"Las personas con licencia ha conseguido ser más productivas,
han conseguido tener
documentos entregables de más calidad y además
que la experiencia de empleado ha mejorado".
Esos empleados ahorran de media dos horas a la semana.
Así que, desde junio,
toda la plantilla tiene acceso a la versión online,
y 3.000, de momento, a una más avanzada,
que permite analizar también material propio
como informes, correos, contactos...
"Tenemos que desaprender
porque no se trata de meterla en el día a día
como una cosa más, porque así sería muy ineficiente.
Lo que tenemos es que transformar como trabajamos incorporando la IA,
y haciendo las tareas de otra manera".
Calculan que la productividad se ha incrementado
por encima del 7 por ciento.
Es importante, dicen, ser pioneros.
"Si entendemos que tenemos un impacto muy relevante;
si entendemos que va a traer mucha productividad,
nos va a dar ventaja competitiva.
Me encanta la frase, Martin Luther King:
'No hace falta que veas el final de la escalera
para empezar a subir el primer peldaño'.
Pues en eso estamos".
Integrar la IA generativa en todos los procesos posibles
es también una prioridad para Ferrovial.
"Hola chicos, siento el retraso,
pero he leído lo que llevamos hasta el momento y podemos seguir".
"El ser los primeros, pues el proceso de aprendizaje
es un poco más largo pero también es una palanca de diferenciación
a la hora de captar talento.
Actualmente no hay muchas empresas que puedan ofrecer esto".
"Tengo muchas ganas de ver como funciona copilot para power BI
¿podrías enseñarnos un par de ejemplos?"
Están midiendo las ventajas, no solo en tareas de oficina,
también sobre el terreno y algunas áreas concretas
como el marketing o la ciberseguridad.
Es el principio, la peor tecnología que habrá de este tipo, pero
dicen que integrarla ya en el día a día,
es más que una ventaja competitiva,
es toda una declaración de intenciones.
En la carrera de la tecnología punta en IA
Sánchez en su intervención ha repasado el potencial de la IA y ha enfatizado la necesidad de situar a España a la cabeza de la innovación. Todos los Gobiernos, destaca Curto, compiten en el ámbito de la inteligencia artificial para alcanzar la "soberanía tecnológica". El experto señala tres aspectos fundamentales para dominar esta carrera. El primero de ellos es la capacidad de cómputo. Considera que, en este sentido, es crucial la labor del BSC. Cree necesario, además, diseñar conjuntos de datos dentro del país, ya que "permite que España tenga capacidad en datos que son propios y se han generado de forma específica para nuestro contexto".
El tercer aspecto es la capacidad de innovación. Son muchos los Gobiernos que trabajan en esta línea. Curto aclara que el mecanismo es diferente en Europa, al contar con una regulación que establece una Oficina de Inteligencia Artificial en Europa y en los distintos países, como España: "Derivado de la regulación, surgen las dudas sobre cómo innovar. Esta familia da posibilidades a pequeñas empresas que no tienen capacidad de entrenamiento desde cero. Con este modelo, pueden implementar mecanismos de innovación".
ALIA forma parte de la estrategia para situar a España en un buen nivel, asegura Curto, que lo considera muy relevante, puesto que el país no destaca en los diferentes índices de innovación. El experto advierte de que "no se trata solo de innovar puntualmente, es una carrera de fondo". A pesar de que son pasos positivos, entiende que "hay que hacer aún más trabajo".
El anuncio del presidente asegura que el modelo ya está "disponible para todos los usuarios", pero esta afirmación no significa que cualquier interesado pueda acceder a ALIA, como lo haría con ChatGPT o Copilot. El proyecto proporciona material a empresas, desarrolladores independientes, instituciones, universidades e investigadores para que implementen sus propias herramientas de IA basadas en esta familia de modelos de lenguaje. "Lo que se busca es generar capacidad de innovación y de trabajo", explica Curto.
Hasta ahora, las universidades o las empresas podían utilizar otros modelos disponibles, como Llama de Meta, pero "se encontraban con limitaciones, por ejemplo, en esa fase de contextualización". ALIA pretende mejorar la aplicación de la IA a las políticas públicas, en consonancia con la Estrategia Nacional de Inteligencia Artificial y la normativa europea. El proyecto contempla que la ciudadanía se beneficie de manera indirecta, a través de mejoras en la productividad y la accesibilidad de los servicios.