Logotipo de Zephyrnet

El Congreso dijo que las empresas de inteligencia artificial deberían pagar por el contenido protegido por derechos de autor

Fecha:

Las empresas de tecnología deberían compensar a los editores de noticias por entrenar modelos de inteligencia artificial en su contenido protegido por derechos de autor, dijeron expertos en medios a los senadores en una audiencia esta semana.

El Comité Judicial del Senado de los Estados Unidos líderes interrogados de asociaciones comerciales de medios y académicos sobre cómo la IA generativa afecta a la industria del periodismo.

El periodismo siempre se ha adaptado a medida que se inventan nuevas tecnologías. El auge de Internet ha recortado los periódicos y ha impulsado la palabra escrita en línea. Los editores cambian sus estrategias editoriales para aparecer en los primeros puestos de las clasificaciones de Google, atrayendo lectores y anunciantes digitales. Pero, ¿cómo les irá frente a los grandes modelos de lenguaje que pueden generar texto automáticamente?

Los modelos de IA generativa, entrenados en grandes cantidades de Internet, pueden producir todo tipo de contenido. El El New York Times demandó recientemente a OpenAI, acusando a la startup de extraer ilegalmente "millones de [sus] artículos de noticias protegidos por derechos de autor, investigaciones en profundidad, artículos de opinión, reseñas, guías prácticas y más".

No solo se alega que OpenAI robó su trabajo, sino que The New York Times afirmó que ahora se estaba beneficiando injustamente de él al generar pasajes de sus artículos palabra por palabra, lo que permitía a los internautas evadir su muro de pago. En un intento por recuperar algo de poder de las empresas de tecnología, los editores ahora están luchando por una compensación y tratando de negociar acuerdos de licencia. Pero es una batalla difícil de ganar, especialmente si la ley no está de su lado.

No está claro si la IA generativa viola las leyes de derechos de autor actuales. Los desarrolladores de los modelos creen que su uso del contenido raspado de Internet deben estar protegidos bajo uso legítimo ya que sus chatbots crean y producen texto que transforma y trasciende el material original. Abierto AI insistió que ChatGPT regurgitar contenido protegido por derechos de autor era un "error poco común".

Roger Lynch, director ejecutivo de la editorial de revistas Condé Nast, no estuvo de acuerdo. “El uso legítimo es permitir la crítica, la parodia, la erudición, la investigación y la presentación de noticias”, dijo a los senadores. "La ley es clara cuando hay un efecto adverso en el mercado del material protegido por derechos de autor... El uso legítimo no pretende simplemente enriquecer a las empresas de tecnología que prefieren no pagar".

Hay otras formas en que herramientas como ChatGPT pueden afectar las ganancias de los editores más allá de reproducir sus historias. Danielle Coffey, directora ejecutiva de la asociación comercial News/Media Alliance, señaló que los chatbots diseñados para rastrear la web y actuar como un motor de búsqueda, como Microsoft Bing o Perplexity, también pueden resumir artículos.

Los lectores podrían pedirles que extrajeran y condensaran información de los informes de noticias, lo que significaría que habría menos incentivos para que la gente visitara los sitios de los editores, lo que llevaría a una pérdida de tráfico e ingresos por publicidad. "No habría ningún modelo de negocio para nosotros en ese ecosistema", dijo durante la audiencia.

Los acuerdos de licencia mantendrán a flote la industria del periodismo, ya que brindarían a los medios de comunicación una forma de ganar dinero con la IA generativa. Los acuerdos deben negociarse de una manera que no impida que los desarrolladores más pequeños construyan sus propios modelos de lenguaje grandes. Jeff Jarvis, quien recientemente se jubiló de la Escuela de Periodismo de Newmark de la Universidad de la Ciudad de Nueva York, está en contra de las licencias para todos los usos y temía que pudiera sentar precedentes que afectarían a los periodistas y a las pequeñas empresas de código abierto que compiten con las grandes tecnologías.

Es difícil encontrar una manera justa de compensar a los editores sin saber qué contenido y cuánto se utilizó exactamente para entrenar modelos de IA. Coffey propuso la idea de que las empresas de tecnología deberían crear una base de datos con capacidad de búsqueda que catalogue todos los sitios web que han sido eliminados. Las empresas de inteligencia artificial pueden argumentar que es demasiado complicado y engorroso clasificar las enormes cantidades de texto que han acumulado a lo largo del tiempo.

Revelar sus fuentes también podría hacer que sus herramientas de inteligencia artificial se vean mal, considerando la cantidad de texto inapropiado que han ingerido sus modelos, incluida información personal de las personas y contenido tóxico o NSFW.

"La idea de que la industria tecnológica está diciendo que es demasiado complicado otorgar licencias a tal variedad de propietarios de contenido no se sostiene", dijo Curtis LeGeyt, presidente y director ejecutivo de la Asociación Nacional de Radiodifusores. "Durante las últimas tres décadas, las emisoras de televisión locales han firmado literalmente miles de acuerdos con sistemas de cable y satélite en todo el país para la distribución de su programación".

Lynch instó al Congreso a aclarar que la capacitación sobre materiales protegidos por derechos de autor es ilegal y no es un uso legítimo. LeGeyt, sin embargo, dijo que aprobar nueva legislación para aclarar el problema puede ser prematuro si se puede solucionar mediante un litigio. “Si tenemos claro que las leyes actuales se aplican a la IA generativa, dejemos que el mercado funcione. Si se trata de una carrera armamentista sobre quién puede gastar más en litigios, sabemos que la industria tecnológica supera a todos los demás”.

Aunque empresas como OpenAI creen que la formación se considera uso legítimo, la startup está actuando con más cautela a medida que se acumula el número de demandas en su contra. Hasta ahora ha conseguido acuerdos de licencia con Axel Springer de Associated Press y está según se informa en conversaciones con CNN, Fox Corp y Time. 

"Aunque negocian con nosotros, su punto de partida es 'no queremos pagar por contenido que sabemos que deberíamos poder obtener gratis'", dijo Lynch. Si las empresas de tecnología se salen con la suya y los tribunales deciden que la IA generativa no viola los derechos de autor, de todos modos deberían pagar a los editores por usar sus materiales, dijo LeGeyt.

“Estas tecnologías deberían otorgar licencias a nuestro contenido. Si no es así, el Congreso debería actuar”, instó a los senadores. ®

punto_img

Información más reciente

punto_img