'The New York Times' demanda a Microsoft y OpenAI por entrenar sin permiso su IA con sus artículos
- El diario pide responsabilidades a los demandados por la pérdida de "miles de millones de dólares" en daños y prejuicios
- "No existe jurisprudencia suficiente en copyright y su relación con la inteligencia artificial", afirma Muñoz, abogado digital
Uno de los mayores referentes del periodismo mundial ha decidido plantar cara a los modelos de inteligencia artificial generativa. Un nuevo nubarrón se ha vuelto a posar sobre este tipo de tecnologías después de que este miércoles The New York Times haya demandado a Microsoft y Open AI por utilizar sus textos sin permiso para entrenar a sus modelos de IA. Esta se suma a la oleada de demandas dirigidas contra grandes tecnológicas que se llevan observando desde finales de 2022.
Según la solicitud, millones de artículos publicados por ese diario se utilizaron para entrenar modelos de IA que luego han servido para publicar noticias y competir con la empresa que proporcionó esas noticias en primer lugar.
"A través de Bing Chat de Microsoft (actual Copilot) y ChatGPT de Open AI, los demandados buscan aprovecharse de la enorme inversión de The Times en su periodismo, usándolo para construir productos sustitutivos sin permiso ni pago", se puede leer en la demanda, presentada en un tribunal de Manhattan.
Aunque el periódico no busca una compensación económica, sí que pide responsabilidades a los demandados por la pérdida de "miles de millones de dólares" en daños y prejuicios, así como que se destruyan los modelos de IA que utilizan información con derechos de propiedad intelectual de este diario neoyorquino.
También se incluyen ejemplos de varios textos producidos por GPT-4 (uno de los productos de OpenAI) que son casi indistinguibles de algunas investigaciones publicadas por el medio. Al mismo tiempo, muestran que se le puede pedir al buscador Bing, de Microsoft, que copie párrafos enteros de noticias del Times, que requiere una suscripción para leer gran parte de su contenido.
Los chatbots de IA como ChatGPT utilizan enormes cantidades de datos de texto para predecir la palabra más probable en respuesta a una pregunta, con lo que consiguen recrear con exactitud el discurso humano. El problema viene en que, en muchas ocasiones, esos textos que utilizan para entrenar el modelo, como artículos de prensa, están protegidos por derechos de propiedad intelectual.
"Lo que están diciendo aquí la mayoría de autores es que ningún tercero puede incorporar información a su sistema sin permiso del autor original o el titular de los derechos. Estas personas demandan que si las máquinas han sido alimentadas con sus obras deben de ser compensados", ha explicado a RTVE el abogado digital especializado en IA, Joaquín Muñoz.
Este tipo de acuerdos ya se están observando desde hace un tiempo. A comienzos de este mes, la mismísima OpenAI, cuyo principal inversor es Microsoft, llegó a un acuerdo con la empresa Axel Springer, que publica los medios Politico, Business Insider o Bild, para utilizar su contenido a cambio de una tasa. Lo mismo ocurrió en julio entre The Associated Press y la startup. Esta última tendrá acceso a contenidos de los archivos de este medio desde el año 1985, con el objetivo de mejorar la eficacia de futuras versiones de ChatGPT, según apuntó la alianza.
"Creo que pasará algo muy parecido a lo que ocurre con la Sociedad General de Autores y Editores. No tendrás que ir a cada uno de ellos a pagar por el uso que haces de su música. Solo tendrás que pagar una cuota general por usar su contenido", explica Muñoz.
Mientras tanto, este experto en IA recalca que el papel que tendrán que adquirir industrias como el periodismo y otros sectores será más "creativo". "Va a haber un cambio en el trabajo que hacemos y se tendrá que pensar en crear otro tipo de contenido más artístico o de relacionado con la investigación", añade.
La legislación es clara, pero insuficiente
Este abogado digital explica que ya desde finales de los 80 se lleva hablando, en especial en ámbitos como la propiedad intelectual, sobre este debate entre derechos de autor e IA. Sin embargo, hoy en día se continúa trabajando para lograr un marco legal concreto.
Muñoz considera que en este caso no hace falta una normativa específica, ya que las leyes de propiedad intelectual son claras cuando se trata de la violación de los derechos de autor.
"Si publicas una obra de alguien tienes que tener permiso y esos derechos tienen que ser cedidos expresamente. No puedes coger en Internet miles de imágenes con derechos para luego ponerte a vender camisetas. Esto es lo que hacen este tipo de tecnologías", afirma Muñoz, "todo esto posiblemente sea objeto de actualización de esas normativas existentes para poder adaptarse a la realidad de estos nuevos tiempos".
Este experto subraya que las legislaciones, en especial el Reglamento Europeo sobre la IA, que se están sacando hacia delante quieren obligar a que estas startups y empresas tecnológicas sean cada vez más transparentes con los productos que ofrecen y cómo los han conseguido. "Además, el usuario tiene que saber en todo momento que el contenido que consume está generado por una computadora y no una persona", concluye, "sin embargo, aún queda un largo camino".
Negociaciones previas
El pasado abril los responsables de The Times se pusieron en contacto con Microsoft y OpenAI. El motivo, mostrar su preocupación por el uso de su propiedad intelectual para llegar a una "solución amigabe", teóricamente a través de un acuerdo comercial que concediera a estas empresas una licencia para entrenar sus modelos de IA con los textos publicados en el periódico. Sin embargo, no se dio tal acuerdo, según afirmó el diario, y tampoco fueron revelados los motivos por los que ambas tecnológicas decidieron rechazarlo.
Pese al debate que ha despertado tras el anuncio de la demanda, The Times no quiere renunciar a usar este tipo de tecnología. Incluso, ha contratado a un director de iniciativas de IA para dirigir y evaluar formas en las que poder aprovecharse de esta tecnología dentro del ámbito del periodismo. Sin embargo, el medio trata de "defender sus contenidos" por medio de esta demanda.