Algoritmos, precisión y detalle en una cobertura electoral
- RTVE investigará cómo cubrir con IA las elecciones en municipios de menos de 1.000 habitantes.
- La empresa española Narrativa, por experiencia y tecnología, colabora en este proyecto innovador que pretende situar a RTVE como un medio público pionero al servicio de sus ciudadanos.
RTVE, como prueba de Innovación, realizará un proyecto de investigación aplicada de un sistema que, basándose en tecnologías de Inteligencia Artificial y a partir de los datos suministrados por fuentes de información oficiales, los interprete y transforme en una noticia relativa a la información electoral de los casi 5.000 municipios de España que cuentan con menos de 1.000 habitantes. Este proceso, creado automáticamente con texto en lenguaje natural, siempre estará supervisado por profesionales para certificar y verificar su calidad informativa, editorial y visual.
Según Pere Vila, Director de Estrategia Tecnológica e Innovación Digital de RTVE, “la redacción de textos es una parte esencial de nuestra empresa. RTVE cuenta con un equipo del orden de los 1800 periodistas que redactan semanalmente miles de noticias para televisión, para radio y para los nuevos soportes. La aparición y el desarrollo de nuevas herramientas que faciliten esta redacción de texto y su aplicación al ámbito informativo es, por tanto, especialmente relevante para una empresa como la nuestra. El enfoque de este proyecto encaminado a ámbitos socialmente importantes que ahora RTVE no cubre, la posibilidad que nos ofrece de aprender, experimentar y formarnos a lo largo de su desarrollo, y el hecho de que se esté planteando un diseño final personalizado por y para RTVE, son quizás los tres puntos más destacados. El hecho de abordarlo simplemente nos sitúa en el mapa, nos hace visibles, tanto a nivel español como europeo. Además hace patente el interés de RTVE en investigar, en mejorar, en evolucionar y en adaptarse al futuro entorno”.
El diseño conceptual, la estructura del producto y el estilo de los textos serán elaborados por RTVE, dentro de un proyecto que se prolongará a lo largo de 30 meses. Durante este período se realizarán un mínimo de tres pruebas completas, end to end, que simulen y validen los modelos propuestos. Además, dada la vertiginosa velocidad con la que evoluciona la Inteligencia Artificial, se contempla la posibilidad de incorporar nuevas tecnologías que permitan complementar y mejorar el alcance del proyecto como, por ejemplo, el nuevo lenguaje GPT-3 recientemente lanzado.
La información y el contenido tratados no son los que habitualmente cubren los profesionales de la información. Ahora podrá generarse en cuestión de minutos, mejorando la cantidad y calidad de información de RTVE dedicada a las elecciones en estos municipios. Para Carmen Pérez Cernuda, Subdirectora de Estrategia Tecnológica e Innovación Digital de RTVE, la llegada de estas tecnologías a RTVE proporcionará “conocimiento exhaustivo y tener una presencia efectiva en un área tecnológica que es en nuestros días “la punta de lanza” del actual desarrollo técnico, además de poder observar desde una posición privilegiada los avances y la dirección de los proyectos en un campo de máxima actualidad y con un futuro muy prometedor. Esas nuevas y pioneras tecnologías nos ayudan a posicionar a nuestra empresa en una situación única en cuanto a la utilización de las mismas para continuar ofreciendo a nuestro público objetivo, de forma más rápida, eficaz y eficiente, una información de calidad que nos diferencie de los demás medios de comunicación. Hará posible la llegada de noticias de forma más real y centrada en las que verdaderamente interesan a los usuarios de la llamada “España vaciada”, que de otra forma no tendrían, y ofrecerá una información personalizada que les resulte más atractiva y atrayente que, en definitiva, permita su vinculación con RTVE”.
Contar con estas herramientas y tecnologías para dar mayor cobertura en centros territoriales, dando voz e información sobre poblaciones nunca cubiertas supone “llenar lo que considero que ha sido hasta ahora un vacío informativo. Las elecciones arrojan miles de datos y análisis que, paradójicamente, dejan fuera a las pequeñas poblaciones, más allá de reflejar unos resultados finales”, según Silvia García Vega, Coordinadora de Centros Territoriales de RTVE. “Debería ser, creo, justo al revés. La información local debería centrar los esfuerzos de los grandes medios. Es ahí donde se pueden marcan las diferencias y la capacidad de un medio de comunicación como RTVE. En un momento de sobreinformación, con acceso fácil y gratuito a todo tipo de contenidos, pero a menudo sin filtros de procedencia ni veracidad, y con una población cada vez más acostumbrada a tener datos de manera inmediata, la información local, veraz, contrastada y amplia es un nicho que muchos medios descuidan por falta de capacidad o de interés. Las elecciones, como experiencia piloto, son una oportunidad para que RTVE fomente y amplíe la información más cercana a los ciudadanos que, insisto, creo que debería ser, no el futuro, sino el presente”.
IA en los medios
Usar Inteligencia Artificial es una herramienta, ya no solo una posibilidad, utilizada en casos similares por varias corporaciones públicas en Europa, como ha sido el caso de la BBC en Gran Bretaña, Yle en Finlandia o France TV en el país galo. En este proyecto Pere Vila asegura que, aún teniendo un “fuerte carácter experimental”, se quieren “obtener múltiples resultados, siendo los más relevantes:
- Conocer en profundidad el estado del arte, la aplicabilidad real y el resultado en la práctica de la utilización de este tipo de tecnologías.
- Ofrecer un servicio que hasta ahora no ofrecíamos, encaminado a generar contenidos de especial relevancia y sensibilidad social, poniendo nuestro grano de arena en mejorar aspectos informativos enfocados a la España vaciada.
- Formar dentro de RTVE un grupo de profesionales de distintas disciplinas, técnica, periodística, especialistas en el uso de la inteligencia artificial en el ámbito periodístico.
- Dar un primer paso en la incorporación e integración en nuestro día a día de estas tecnologías que, en nuestra opinión, tendrán una incidencia muy importante y quizá sean determinantes en el futuro de nuestro sector.
- Y como decíamos, "situar en el mapa relacionado con la IA a RTVE y al sector audiovisual español”.
El resultado de este trabajo solo podrá ser explotado por RTVE en las elecciones municipales españolas previstas para 2023, sin que se haya planteado su cesión a terceros. También podrá proponerse su utilización habitual en posteriores comicios en la forma que se considere más adecuada y manteniendo los necesarios criterios de actualización y personalización de uso de la herramienta.
Suma de experiencia y profesionales
Para este proyecto RTVE confiará en la tecnología y experiencia de Narrativa, empresa española pionera en generación de lenguaje natural (NLG por sus siglas en inglés), que pondrá a disposición del ente público su tecnología de Inteligencia Artificial para la creación de narrativas. Para David Llorente, CEO de Narrativa, “la combinación de un ente público como RTVE, que cuenta con grandes profesionales de la información, y una empresa como Narrativa, pionera en el mundo en la generación de lenguaje natural, puede marcar el camino de lo que vendrá en los próximos años. En el caso de RTVE, que es la televisión de todos, sentimos una gran responsabilidad por hacer las cosas bien. La colaboración público-privada es imprescindible para introducir los últimos avances tecnológicos, en nuestro caso, la Inteligencia Artificial aplicada a la automatización de contenidos”.
Esta colaboración, en palabras de Carmen Pérez Cernuda, es “muy positiva. Siempre colaborar desde RTVE con una empresa española, en cualquier área, es muy gratificante de por sí, máxime con ésta que ha alcanzado, y sin duda seguirá consiguiendo en el futuro inmediato, unas cotas de desarrollos tecnológicos de altísimo nivel, incluso en un mercado tan difícil como es el internacional. No podemos por menos que intentar trabajar con empresas de gran prestigio/presencia y en expansión, sobre todo en un campo tan en auge e innovador, pues así, sin duda, sumaremos y los productos que se consigan tendrán el marchamo de la altísima calidad que nuestra corporación exige y por otra parte ofrece a sus colaboradores”.
Narrativa ya cuenta con experiencia previa en la transmisión en directo de las elecciones generales. En el año 2019, se generaron un total de 40.000 noticias sobre los resultados de los más de 8.000 municipios de España, ofreciendo datos tanto a nivel nacional como a nivel provincial. Los contenidos fueron generados automáticamente a través de la tecnología de Narrativa, basada en la combinación de Inteligencia Artificial y aprendizaje profundo (Deep Learning), que transforma datos en narrativas. Los textos comenzaron a generarse en el momento en el que se inició el escrutinio en los municipios y se mantuvieron hasta pasado el recuento final de los votos.
Como periodista, Silvia García Vega considera que “colaborar, unir esfuerzos y talento es siempre positivo. Siempre. Sería ideal que RTVE estuviera a la vanguardia de todo lo que esté por llegar con medios propios. Tan ideal como utópico. Los avances tecnológicos van tan rápido y de manera tan especializada que sería poco inteligente no contar con empresas y profesionales que suman, cada uno aportando sus mejores capacidades y profesionales. La amplia red de profesionales de RTVE unida a la tecnología y a estas herramientas puede ser la combinación perfecta para cumplir como servicio público. Una mayor cobertura informativa a nivel local afianza una de las razones de ser de RTVE. Vuelvo a la falta de capacidad o, sobre todo, de rentabilidad de las noticias de pequeñas poblaciones para los medios privados. Cubrir estas necesidades, además de una obligación para RTVE, es una oportunidad”.
Alberto Moratilla, CTO de Narrativa, recalca la importancia de “los sistemas de computación en la nube que emplearemos para generar decenas de miles de artículos basados en datos, varios por cada población, a medida que evoluciona el escrutinio con resultados parciales en la noche electoral, de manera que cada ciudadano disponga de la información de su localidad al instante. Además, gracias al análisis con Inteligencia Artificial, se facilita enormemente la redacción automática de artículos nuevos basados en datos empleando el estilo periodístico de RTVE”.
Apuesta por la innovación
RTVE trabaja desde hace años con herramientas y proyectos basados en IA. De hecho, el ente público colaboró con Narrativa a través de un proyecto piloto firmado con EFE, la primera agencia de noticias en español y la cuarta del mundo, para la automatización de noticias deportivas. La experiencia se realizó con contenido que actualmente no es tratado por los redactores de RTVE, en este caso la 2ªB de la liga española de fútbol y la Liga Iberdrola. El contenido generado pasa siempre por la supervisión de un periodista antes de su difusión, aunque se puede publicar automáticamente.
Además, en el comienzo de la pandemia, RTVE y Narrativa participaron en el proyecto ‘Data for Hope’, celebrado del 15 al 17 de abril. En el evento, en formato hackaton, se aportaron soluciones a la crisis provocada por la COVID-19 a través de la recopilación de datos.
RTVE colabora también con Narrativa en su base de datos sobre la COVID-19, un proyecto sin ánimo de lucro que se desarrolló al inicio de la emergencia sanitaria y que pone a disposición de los medios y otras instituciones la mayor base de datos, informes, gráficas e imágenes de la evolución de esta enfermedad en España y en el mundo. El proyecto continúa vigente y se han generado cerca de 1.500.00 noticias en estos meses.
La combinación entre la experiencia de los profesionales de RTVE y la tecnología de Narrativa tendrá como resultado un proyecto pionero en nuestro país. Además, permitirá al ente público posicionarse como una corporación puntera en Europa. Gracias a esta colaboración entre RTVE y Narrativa, “podremos poner a disposición del ente público los últimos avances en Inteligencia Artificial aplicada al tratamiento de lenguaje natural (NLP en sus siglas en inglés) y más concretamente a la generación de contenido o generación de lenguaje natural (NLG). De este modo se podrá aprovechar el crecimiento exponencial que está teniendo este campo de la IA en los últimos años gracias a la aplicación de técnicas de Deep Learning, y que han dado lugar a modelos como Word2Vec, BERT, o los impactantes GPT-2 y GPT-3” asegura Alberto Moratilla.
En opinión de Pere Vila estas actividades y proyectos “son importantes y necesarias, pero no solo para la imagen de RTVE, sino también por la influencia directa que tiene sobre otras empresas españolas. Si incorporamos de manera temprana estas tecnologías en RTVE, esto influirá sin duda en forma positiva en las empresas españolas que están trabajando estos temas, mejorará sus conocimientos, experiencia e imagen exterior”. David Llorente afirma que “RTVE y Narrativa podremos apoyarnos mutuamente para progresar, aportando lo que mejor sabemos hacer en nuestro ámbito. Con esta iniciativa esperamos ayudar a RTVE a situarse como un medio público pionero en generación de lenguaje natural al servicio de sus ciudadanos”.