En Resumen
- La comediante Sarah Silverman y dos novelistas demandan a Meta y OpenAI por utilizar su material con derechos de autor para entrenar chatbots sin permiso.
- Los abogados afirman que ChatGPT de OpenAI admitió utilizar bases de datos de libros, posiblemente incluyendo obras con derechos de autor, como el proyecto Gutenberg y bibliotecas sombra.
- Los juicios liderados por el bufete de abogados Joseph Saveri buscan proteger los derechos de los artistas y preservar la viabilidad de las carreras creativas frente al avance de la IA.
La comediante Sarah Silverman se ha unido a dos novelistas para presentar un caso potencialmente innovador contra Meta y OpenAI, alegando que su material con derechos de autor fue utilizado para entrenar chatbots sin permiso.
Las demandas colectivas presentadas por Silverman junto con los autores Christopher Golden y Richard Kadrey, afirman que sus libros fueron "ingeridos" para entrenar a ChatGPT de OpenAI y LLaMA de Meta sin su permiso, según documentos presentados a un tribunal de San Francisco el viernes por la noche.
ChatGPT y LLaMA son ambos modelos de lenguaje grandes o Large Lenguaje Models (LLM), un tipo de algoritmo de inteligencia artificial que se entrena con grandes cantidades de datos recopilados de múltiples fuentes. Esto ha llevado a acusaciones de que los desarrolladores están robando información de obras disponibles públicamente, pero protegidas.
En la demanda contra OpenAI, los abogados de Silverman y los otros demandantes dijeron que la compañía había admitido que utilizó bases de datos de libros durante el entrenamiento de ChatGPT.
Si bien no se han revelado los conjuntos de datos exactos utilizados, los abogados utilizaron la deducción para sugerir que uno de ellos era el proyecto Gutenberg, una biblioteca digital de dominio público. El otro probablemente era una "biblioteca sombra" como Library Genesis, Z-Library o Sci-Hub, que a menudo contienen materiales con derechos de autor.
Para demostrar su punto, los abogados pidieron a ChatGPT que resumiera las obras de cada uno de los autores.
Aunque algunos detalles estaban equivocados, argumentaron que los resultados muestran que ChatGPT "conserva el conocimiento de obras particulares en el conjunto de datos de entrenamiento y es capaz de generar contenido textual similar".
Una "lucha más grande" por los derechos de los artistas
Los juicios son liderados por el bufete de abogados Joseph Saveri de San Francisco, junto con el abogado y autor Matthew Butterick. Además de los casos de Silverman, el mismo equipo también ha presentado un caso separado en representación de los autores Paul Tremblay y Mona Awad en una acción colectiva contra OpenAI.
A finales del mes pasado, Joseph Savari dijo que era "crítico que reconozcamos y protejamos los derechos de autores como estos contra el robo y fraude ilegal".
"GPT-3.5 y GPT-4 no solo son una infracción de los derechos de los autores; ya sea que lo pretendan o no, modelos como este eliminarán 'autor' como una carrera viable", argumentó Saveri. "Este caso representa una lucha más grande por preservar los derechos de propiedad para todos los artistas y otros creadores".
El rápido avance de la IA ha causado controversia y angustia existencial para los artistas en todas las industrias creativas. Durante un podcast en mayo, la megaestrella Tom Hanks reveló que los actores ahora están luchando por asegurar los derechos digitales de sus imágenes gracias al auge de la IA.
La semana pasada, Japón tomó una postura temprana sobre el tema, decidiendo que los entrenadores de modelos pueden recopilar datos públicos sin tener que obtener licencia o permiso de los propietarios.
En otros lugares, la cuestión de lo que constituye una infracción de derechos de autor está lejos de resolverse.
La Unión Europea ha propuesto que las empresas deberán revelar cualquier material con derechos de autor utilizado en el desarrollo de sus sistemas. La Oficina de Derechos de Autor de Estados Unidos ha lanzado una iniciativa para examinar los problemas legales y de política planteados por la IA.