En Resumen
- Reddit presentó una demanda contra Anthropic, acusándola de extraer datos sin autorización para entrenar Claude tras acceder más de 100.000 veces a sus servidores
- La empresa alegó que Anthropic mostró "dos caras", proyectando responsabilidad públicamente mientras violaba reglas privadamente para beneficio económico
- Reddit buscará daños y una orden que prohíba el uso de su contenido, mientras mantiene acuerdos propios con OpenAI y Google para licenciar datos de usuarios
Reddit ha presentado una demanda contra la empresa de inteligencia artificial Anthropic, acusando a la compañía de extraer datos de su plataforma y usar contenido de Reddit sin autorización para entrenar su modelo de IA Claude.
La denuncia, presentada el miércoles en un tribunal federal estadounidense, alega que Anthropic violó el acuerdo de usuario de Reddit y continuó accediendo a los servidores de Reddit, incluyendo hacerlo más de 100.000 veces después de afirmar públicamente haber cesado tal actividad en julio de 2024.
Reddit busca daños, restitución y una orden judicial que prohíba a Anthropic usar cualquier dato derivado de Reddit en sus productos, incluyendo impedir que la empresa licencie o se beneficie de cualquier programa de IA entrenado con contenido de Reddit.
Decrypt se ha puesto en contacto con Anthropic para una respuesta a las afirmaciones de Reddit.
El gigante de las redes sociales afirmó que había "dos caras" en la empresa de IA, que ha tratado de posicionarse como el actor responsable en la industria de la IA.
"[Está] la cara pública que intenta congraciarse con la conciencia del consumidor con afirmaciones de rectitud y respeto por los límites y la ley, y la cara privada que ignora cualquier regla que interfiera con sus intentos de llenar aún más sus bolsillos", dice la demanda.
En el corazón de la disputa está una controversia más amplia sobre cómo se entrenan los Large Language Models o LLMs. Desde el debut de ChatGPT de OpenAI, las preocupaciones han escalado sobre el uso tanto de materiales con derechos de autor como de contenido generado por usuarios en el desarrollo de IA.
Problemas continuos
Varias demandas ya han sido presentadas por diferentes organizaciones, incluyendo un caso de alto perfil presentado por The New York Times contra OpenAI y Microsoft en 2023. Otros demandantes incluyen artistas visuales, autores y compañías discográficas que argumentan que su trabajo fue explotado sin permiso.
Anthropic también está enfrentando otra demanda respecto a su supuesto uso de letras de canciones con derechos de autor, así como otra más de un grupo de autores que dijeron que la compañía usó versiones pirateadas de sus libros como materiales de entrenamiento.
La tensión se ha derramado al ámbito cultural, con artistas expresando indignación por imitaciones generadas por IA de sus estilos.
A principios de este año, una locura por replicar el estilo artístico de la popular compañía de animación japonesa Studio Ghibli despertó preocupaciones sobre violaciones de derechos de autor y artistas perdiendo frente a programas de IA entrenados con su propio trabajo.
En una presentación al Parlamento del Reino Unido el año pasado, OpenAI reconoció usar contenido con derechos de autor en el entrenamiento, argumentando que sería "imposible" desarrollar sistemas de IA líderes sin ello. La compañía mantiene que tales prácticas son legales.
El mes pasado fue criticada una propuesta en el Reino Unido para flexibilizar la ley de derechos de autor y permitir el uso de materiales con derechos de autor para entrenar LLM, por artistas prominentes, incluyendo Elton John.
A pesar de sus protestas sobre proteger a sus usuarios, Reddit, no ve nada malo en usar contenido de usuarios para entrenamiento de LLM, siempre que sea compensado.
Ha establecido sus propios acuerdos de licenciamiento con empresas como OpenAI, Google, Sprinklr y Cision para permitir acceso a su contenido con fines de entrenamiento.
Editado por Sebastian Sinclair