Tribunal de Múnich Ordena a OpenAI Cesar Reproducción Ilegal de Letras de Canciones Alemanas en ChatGPT

La decisión contra OpenAI podría convertirse en un caso de prueba clave sobre cómo se trata el entrenamiento de IA bajo las leyes de derechos de autor de la UE.

Por Vince Dioquino

4 min lectura

La organización nacional de derechos musicales de Alemania obtuvo una victoria parcial pero decisiva contra OpenAI después de que un tribunal de Múnich dictaminara que los modelos subyacentes de ChatGPT reprodujeron ilegalmente letras de canciones alemanas protegidas por derechos de autor.

El fallo ordena a OpenAI cesar la reproducción, divulgar detalles relevantes del entrenamiento y compensar a los titulares de derechos. Aún no es definitivo y OpenAI puede apelar.

De confirmarse, la decisión podría remodelar cómo las empresas de IA obtienen y licencian material creativo en Europa, mientras los reguladores evalúan obligaciones más amplias de transparencia de modelos y procedencia de datos de entrenamiento.

El caso marca la primera vez que un tribunal europeo determina que un Large Language Model (LLM) violó derechos de autor al memorizar obras protegidas.

En su decisión, la 42ª Cámara Civil del Tribunal Regional de Múnich I señaló que GPT-4 y GPT-4o contenían letras "reproducibles" de nueve canciones conocidas, incluyendo "Atemlos" de Kristina Bach y "Wie schön, dass du geboren bist" de Rolf Zuckowski.

El tribunal determinó que dicha memorización constituye una "fijación" de las obras originales en los parámetros del modelo, satisfaciendo la definición legal de reproducción según el Artículo 2 de la Directiva InfoSoc de la UE y la Ley de Derechos de Autor de Alemania.

"Al menos en casos individuales, cuando se le solicita adecuadamente, el modelo produce un resultado cuyo contenido es al menos parcialmente idéntico al contenido del conjunto de datos de entrenamiento anterior", señala una copia traducida del fallo escrito proporcionada por el tribunal de Múnich a Decrypt.

El modelo "genera una secuencia de tokens que parece estadísticamente plausible porque, por ejemplo, estuvo contenida en el proceso de entrenamiento de forma particularmente estable o recurrente", escribió el tribunal, agregando que debido a que esta "secuencia de tokens apareció en un gran número de sitios web accesibles públicamente", esto significaba que "fue incluida en el conjunto de datos de entrenamiento más de una vez".

En los alegatos, GEMA argumentó que las letras generadas por el modelo eran casi textuales cuando se le solicitaba, demostrando que los sistemas de OpenAI habían retenido y reproducido las obras.

OpenAI respondió que sus modelos no almacenan datos de entrenamiento directamente y que cualquier resultado proviene de los prompts del usuario, no de copia deliberada.

La empresa también invocó excepciones de minería de texto y datos, que permiten reproducciones temporales para uso analítico.

"Estamos en desacuerdo con el fallo y estamos considerando los próximos pasos", dijo un portavoz de OpenAI a Decrypt. "La decisión es para un conjunto limitado de letras y no impacta a los millones de personas, empresas y desarrolladores en Alemania que usan nuestra tecnología todos los días".

OpenAI afirma que sistemas como los suyos no almacenan ni contienen datos de entrenamiento y, por lo tanto, no poseen copias de letras u otros textos. En cambio, estos modelos aprenden patrones y generan nuevos resultados basados en patrones, señaló OpenAI.

La empresa dijo a Decrypt que tratar un modelo como si contuviera obras almacenadas refleja una incomprensión de cómo funciona la tecnología.

El tribunal rechazó esas defensas, dictaminando que las reproducciones completas integradas en la estructura de un modelo quedan fuera del alcance de las exenciones de minería de datos.

"El entrenamiento de los modelos no debe considerarse como una forma de uso habitual y esperada que el titular de derechos deba anticipar", escribió el tribunal. "Esto se aplica aún más cuando —como en el presente caso— las obras se reproducen en el modelo, algo que incluso los propios demandados consideran indeseable y contra lo cual se toman contramedidas".

Decrypt se comunicó por separado con GEMA para solicitar comentarios, pero aún no ha recibido respuesta al cierre de esta nota.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Noticias recomendados