En Resumen

  • El juez Sidney Stein negó el lunes la moción de OpenAI para eliminar la demanda, determinando que las alegaciones previas notificaron adecuadamente a la empresa sobre la infracción por descarga y reproducción de libros protegidos.
  • Los autores David Baldacci, Michael Chabon y otros alegan que OpenAI capturó, descargó y copió obras escritas protegidas por derechos de autor sin permiso para entrenar sus modelos de lenguaje.
  • Navodaya Singh Rajpurohit de Coinque Consulting señaló que los autores deberán mostrar evidencia concreta de que sus libros estaban en los datos de entrenamiento mediante registros de salida y metadatos ordenados por el tribunal.

OpenAI ha sufrido un revés legal en su batalla por derechos de autor, luego de que un juez federal dictaminara que los autores pueden proceder con las demandas de que la compañía descargó ilegalmente sus libros.

El juez de distrito de Estados Unidos Sidney H. Stein negó el lunes la moción de OpenAI para eliminar lo que la empresa caracterizó como una nueva "demanda de descarga" en un fallo, al determinar que las denuncias previas notificaron adecuadamente a OpenAI sobre las alegaciones de infracción basadas en la descarga y reproducción de libros protegidos por derechos de autor.

"Una denuncia no necesita vincular la reclamación de alivio del demandante a una teoría legal precisa", señaló el juez Stein en su fallo, destacando que "las alegaciones fácticas por sí solas son lo que importa".

El juez otorgó a OpenAI un alivio parcial, eliminando las alegaciones sobre GPT-4V, GPT-4.5, GPT-5 y cualquier "derivado" o "sucesor", con el argumento de que su orden de mayo limita el caso a siete modelos (GPT-3 hasta GPT-4o Mini).

La disputa sobre la "demanda de descarga"

El caso forma parte de un litigio multidistrital (MDL) masivo que consolida numerosas demandas por derechos de autor contra OpenAI y Microsoft en el Distrito Sur de Nueva York. Un MDL combina casos similares de diferentes tribunales en un solo procedimiento para un manejo previo al juicio eficiente.

Esta acción consolidada incluye denuncias de los autores David Baldacci, Michael Chabon y otros que alegan que OpenAI "capturó, descargó y copió obras escritas protegidas por derechos de autor" sin permiso.

En su moción para eliminar, OpenAI argumentó que la denuncia consolidada introdujo indebidamente una nueva teoría legal al separar las alegaciones de descarga de las reclamaciones basadas en el entrenamiento.

El juez Stein rechazó este argumento, determinando que las denuncias previas de acción colectiva ya habían "afirmado una causa de acción por infracción de derechos de autor y alegado que OpenAI descargó y reprodujo indebidamente los libros de los demandantes".

El hecho de que muchas alegaciones sugirieran que el "propósito final de la reproducción era entrenar los LLM de OpenAI no es determinante", escribió.

Navodaya Singh Rajpurohit, socio legal de Coinque Consulting, afirmó a Decrypt que "los autores pueden necesitar mostrar evidencia concreta de que sus libros estaban en los datos de entrenamiento".

Los tribunales han ordenado la producción de "canales de Slack que discuten la eliminación de los conjuntos de datos de libros" y han requerido que OpenAI conserve "registros completos de salida y metadatos", agregó, para "rastrear si obras específicas fueron ingeridas".

"Estos registros, junto con cualquier archivo de prueba o listas de libros proporcionadas por proveedores, pueden ser importantes en el descubrimiento", señaló el abogado.

OpenAI podría argumentar que las descargas provinieron de fuentes públicas o con licencia, afirmó Rajpurohit, destacando que la empresa ha reconocido la licencia de contenido de editores y sostiene que el entrenamiento con material disponible públicamente es un uso justo transformativo, y las recientes asociaciones con medios sugieren licencias más claras que respaldan la legalidad.

Batallas por derechos de autor en toda la industria

OpenAI está defendiéndose de una serie de demandas por derechos de autor, una liderada por The New York Times, alegando que ella y Microsoft usaron "millones de artículos de pago" para construir un "sustituto de mercado" para las noticias.

En mayo, un tribunal ordenó a OpenAI "preservar y segregar todos los datos de registro de salida", incluidos los chats eliminados; OpenAI impugnó la orden en junio, calificándola como "un exceso de The New York Times" que socava la privacidad del usuario.

En junio, Meta y Anthropic obtuvieron victorias parciales con el juez Vince Chhabria considerando que el entrenamiento de libros de Meta era un uso justo, señalando que los demandantes "hicieron los argumentos equivocados", mientras que el juez William Alsup también determinó que el entrenamiento de Anthropic era un uso justo pero criticó su "biblioteca permanente de libros pirateados".

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.