Logotipo de Zephyrnet

Por qué será difícil defender la demanda por derechos de autor de IA del New York Times

Fecha:

El New York Times (NYT) procedimientos legales contra OpenAI y Microsoft ha abierto una nueva frontera en los continuos desafíos legales que plantea el uso de datos protegidos por derechos de autor para “entrenar” o mejorar la IA generativa.

Ya existen diversas demandas contra empresas de IA, incluida una presentada por Getty Images contra la IA de estabilidad, que crea el generador de texto a imagen en línea de Stable Diffusion. Los autores George RR Martin y John Grisham también han presentado casos legales contra el propietario de ChatGPT, OpenAI, por reclamaciones de derechos de autor. Pero el caso del NYT no es “más de lo mismo” porque arroja a la mezcla nuevos e interesantes argumentos.

La acción legal se centra en el valor de los datos de formación y una nueva cuestión relativa al daño reputacional. Es una potente combinación de marcas registradas y derechos de autor que puede poner a prueba las defensas de uso legítimo en las que normalmente se invoca.

Sin duda, será seguido de cerca por las organizaciones de medios que buscan desafiar el enfoque habitual de "pedir perdón, no permiso" para los datos de entrenamiento. Los datos de entrenamiento se utilizan para mejorar el rendimiento de los sistemas de IA y generalmente consisten en información del mundo real, a menudo extraída de Internet.

La demanda también presenta un argumento novedoso, no presentado en otros casos similares, que está relacionado con algo llamado "alucinaciones", donde los sistemas de IA generan información falsa o engañosa pero la presentan como un hecho. De hecho, este argumento podría ser uno de los más potentes del caso.

El caso del NYT en particular plantea tres interpretaciones interesantes del enfoque habitual. En primer lugar, debido a su reputación de ofrecer noticias e información confiables, el contenido del NYT ha aumentado su valor y atractivo como datos de entrenamiento para su uso en IA.

En segundo lugar, que debido al muro de pago del NYT, la reproducción de artículos bajo pedido es comercialmente perjudicial. En tercer lugar, que ChatGPT Las alucinaciones están causando daños a la reputación del New York Times mediante, efectivamente, una atribución falsa.

Esta no es una disputa más sobre los derechos de autor de la IA generativa. El primer argumento presentado por el NYT es que los datos de entrenamiento utilizados por OpenAI están protegidos por derechos de autor, por lo que afirman que la fase de entrenamiento de ChatGPT infringió los derechos de autor. Hemos visto este tipo de argumentos. correr antes en otras disputas.

¿Uso justo?

El desafío para este tipo de ataque es la escudo de uso legítimo. En los EE. UU., el uso legítimo es una doctrina jurídica que permite el uso de material protegido por derechos de autor en determinadas circunstancias, como en informes de noticias, trabajos académicos y comentarios.

La respuesta de OpenAI Hasta ahora ha sido muy cauteloso, pero un principio clave en una declaración publicada por la compañía es que su uso de datos en línea efectivamente cae bajo el principio de "uso justo".

Anticipando algunas de las dificultades que podría causar tal defensa de uso legítimo, el NYT ha adoptado un ángulo ligeramente diferente. En particular, busca diferenciar sus datos de los datos estándar. El NYT tiene la intención de utilizar lo que afirma ser precisión, confiabilidad y prestigio de sus informes. Afirma que esto crea un conjunto de datos particularmente deseable.

Sostiene que, como fuente acreditada y confiable, sus artículos tienen peso y confiabilidad adicionales en el entrenamiento de IA generativa y son parte de un subconjunto de datos al que se le da una ponderación adicional en ese entrenamiento.

Sostiene que al reproducir en gran medida artículos cuando se le solicita, ChatGPT puede negar al NYT, que es de pago, visitantes e ingresos que de otro modo recibiría. Esta introducción de algún aspecto de competencia comercial y ventaja comercial parece tener como objetivo evitar la habitual defensa de uso legítimo común a estas reclamaciones.

Será interesante ver si la afirmación de una ponderación especial en los datos de entrenamiento tiene algún impacto. Si lo hace, abre el camino para que otras organizaciones de medios cuestionen el uso de sus informes en los datos de capacitación sin permiso.

El elemento final de la afirmación del NYT presenta un ángulo novedoso al desafío. Sugiere que se está causando daño a la marca NYT a través del material que produce ChatGPT. Si bien casi se presenta como una ocurrencia tardía en la queja, aún puede ser el reclamo que causa la mayor dificultad a OpenAI.

Este es el argumento relacionado con las alucinaciones de la IA. El NYT sostiene que esto se ve agravado porque ChatGPT presenta la información como proveniente del NYT.

El periódico sugiere además que los consumidores pueden actuar basándose en el resumen proporcionado por ChatGPT, pensando que la información proviene del NYT y es confiable. El daño a la reputación se debe a que el periódico no tiene control sobre lo que produce ChatGPT.

Este es un desafío interesante para concluir. Las alucinaciones son un problema reconocido en las respuestas generadas por la IA, y el NYT sostiene que el daño a la reputación puede no ser fácil de rectificar.

El reclamo del NYT abre una serie de líneas de ataque novedosas que trasladan el enfoque de los derechos de autor a cómo ChatGPT presenta los datos protegidos por derechos de autor a los usuarios y el valor de esos datos para el periódico. Esto es mucho más complicado de defender para OpenAI.

Este caso será seguido de cerca por otros editores de medios, especialmente aquellos detrás de muros de pago, y con especial atención a cómo interactúa con la habitual defensa del uso legítimo.

Si se reconoce que el conjunto de datos del NYT tiene el “valor mejorado” que afirma, puede allanar el camino para la monetización de ese conjunto de datos en el entrenamiento de la IA en lugar del enfoque de “perdón, no permiso” que prevalece hoy.

Este artículo se republica de La conversación bajo una licencia Creative Commons. Leer el articulo original.

Crédito de la imagen: Absolut Vision / Unsplash 

punto_img

Información más reciente

punto_img