Los gigantes editoriales y las empresas de inteligencia artificial generativa están alcanzando acuerdos que buscan tanto proteger los derechos de autor como satisfacer las crecientes demandas de la industria de la IA.
La editorial estadounidense HarperCollins firmó un contrato con una empresa tecnológica, cuyo nombre no se ha revelado, permitiéndole usar algunos de sus libros para entrenar sus modelos generativos de IA. En una carta obtenida por AFP, la empresa tecnológica propone un pago de 2,500 dólares (unos 50,000 pesos) por cada libro seleccionado para entrenar su modelo de lenguaje de gran escala (LLM) durante un máximo de tres años.
Los modelos de IA necesitan cantidades masivas de textos para entrenar sus capacidades de uso del lenguaje cotidiano.
“HarperCollins ha llegado a un acuerdo con una empresa de tecnología de inteligencia artificial para permitir el uso limitado de títulos específicos de su catálogo de no ficción con el fin de mejorar la calidad y el rendimiento de los modelos de IA”, indicó la editorial en un comunicado.
La editorial señaló que el acuerdo tiene un “alcance limitado y lineamientos claros sobre la producción del modelo que respetan los derechos de los autores”.
Los autores “pueden optar por participar en el acuerdo o rechazar la oportunidad”, añadió.
El reto de los derechos de autor
La oferta ha recibido reacciones mixtas en el mundo editorial. Escritores como Daniel Kibblesmith han declinado de forma tajante. “Probablemente lo haría por 1,000 millones de dólares. Lo haría por una suma de dinero que me permita no tener que trabajar nunca más, ya que ese es el objetivo final de esta tecnología”, comentó el autor en la red social Bluesky.
HarperCollins es una de las editoriales más grandes en llegar a un acuerdo de este tipo, pero no es la primera.
La editorial científica estadounidense Wiley informó que ha permitido el “acceso a contenido académico y profesional previamente publicado para su uso específico en el entrenamiento de modelos LLM” bajo un contrato de 23 millones de dólares (mdd) con una gran empresa tecnológica no identificada.
Estos acuerdos reflejan la tensión que rodea a los modelos de IA, los cuales recopilan enormes cantidades de contenido de la web, lo que plantea el riesgo de violaciones generalizadas de los derechos de autor.
‘Una conversación más amplia’
Giada Pistilli, jefa de ética en Hugging Face, una plataforma de IA de acceso abierto franco-estadounidense, considera que estos acuerdos son un avance al incluir pagos a las editoriales. Sin embargo, lamenta que ofrezcan poca capacidad de negociación a los autores.
“Lo que vamos a ver es un mecanismo de acuerdos bilaterales entre las nuevas empresas tecnológicas y las editoriales o titulares de derechos de autor. En mi opinión, necesitamos una conversación más amplia que incluya a más actores”, señaló.
Julien Chouraqui, director legal del sindicato de editores franceses (SNE), calificó los acuerdos como “un progreso”.
“Un acuerdo significa que ha habido un diálogo y un deseo de lograr un equilibrio entre el uso de datos fuente, que están sujetos a derechos de autor y que generarán valor”, afirmó.
Las empresas mediáticas también se organizan para enfrentar los desafíos creados por la IA
A finales de 2023, The New York Times demandó a OpenAI, creador de ChatGPT, y a Microsoft, su principal inversionista, por violar las protecciones de derechos de autor. Otros grupos de medios han firmado acuerdos con OpenAI.
Las empresas tecnológicas pueden no tener otra opción que pagar para mejorar sus productos, especialmente ahora que comienzan a quedarse sin nuevos materiales para alimentar sus modelos.
“En la web encuentras una gran cantidad de contenido lícito e ilícito, así como muchas copias pirateadas. Eso no solo genera problemas legales, sino que también plantea cuestiones sobre la calidad de los datos”, dijo Chouraqui del SNE. “Si estamos comprometidos con desarrollar un mercado basado en principios virtuosos, debemos involucrar a todos los actores”, concluyó.