Logotipo de Zephyrnet

Authors Guild demanda a OpenAI por usar libros para entrenar ChatGPT

Fecha:

El Authors Guild, una asociación comercial para escritores publicados, y 17 autores han desatado los dragones en OpenAI por el presunto uso de sus obras para entrenar sus chatbots.

Los demandantes nombrados en la demanda colectiva por infracción de derechos de autor, presentada en el Distrito Sur de Nueva York por derechos de autor, incluyen a David Baldacci, Mary Bly, Michael Connelly, Sylvia Day, Jonathan Franzen, John Grisham, Elin Hilderbrand, Christina Baker Kline y Maya Shanbhag Lang. , Victor LaValle, George RR Martin, Jodi Picoult, Douglas Preston, Roxana Robinson, George Saunders, Scott Turow y Rachel Vail.

El queja [PDF] sostiene que los servicios de OpenAI "ponen en peligro la capacidad de los escritores de ficción para ganarse la vida, en el sentido de que los grandes modelos de lenguaje permiten que cualquiera genere -automática y libremente (o muy barato)- textos que de otro modo pagarían a los escritores para que los crearan".

La denuncia señala que a ChatGPT se le ha pedido con éxito que cree un “esquema detallado para un libro precuela que Un juego de tronos … usando los mismos personajes de los libros existentes de Martin en la serie Canción de Hielo y Fuego.” Resultados similares fueron posibles para los otros autores que se sumaron a la demanda.

La capacidad de ChatGPT para hacerlo es problemática, dado que los autores no autorizaron a OpenAI a acceder a sus trabajos.

La denuncia afirma que OpenAI admitió haber utilizado conjuntos de datos denominados "Libros1" y "Libros2" para entrenar sus grandes modelos de lenguaje, pero no ha revelado su contenido. Los demandantes sospechan que libros piratas han llegado a los datos de entrenamiento de OpenAI.

"El crecimiento en poder y sofisticación de GPT-3 a GPT-4 sugiere un crecimiento correlativo en el tamaño de los conjuntos de datos de 'entrenamiento', lo que plantea la inferencia de que una o más fuentes muy grandes de libros electrónicos pirateados discutidas anteriormente deben haberse utilizado para ' "entrenar' GPT-4", argumenta la denuncia, y agrega: "No hay otra manera en que OpenAI podría haber obtenido el volumen de libros necesarios para 'entrenar' un LLM poderoso como GPT-4".

De hecho, la denuncia menciona otra forma: pagar por el contenido utilizado para entrenar ChatGPT. Pero la demanda alega que OpenAI nunca pensó en hacerlo, y cita el testimonio del CEO Sam Altman ante el Congreso de que cree en los derechos de autor y ha pagado por algunos datos de capacitación.

"Para los escritores de ficción, el uso no autorizado de su trabajo por parte de OpenAI es un robo de identidad a gran escala", afirmó la directora ejecutiva de Authors Guild, Mary Rasenberger.

"Los autores de ficción crean mundos completamente nuevos a partir de su imaginación: crean los lugares, las personas y los eventos de sus historias", añadió, antes de lamentarse: "La gente ya está distribuyendo contenido generado por versiones de GPT que imitan o utilizan las obras de los autores originales". personajes e historias. Las empresas venden mensajes que le permiten "entrar en el mundo" de los libros de un autor. Se trata de claras infracciones de los derechos de propiedad intelectual de los creadores originales”.

Los demandantes quieren “daños por la oportunidad perdida de licenciar sus obras y por la usurpación de mercado que los demandados [OpenAI] han permitido al convertir a los demandantes en cómplices involuntarios de su propio reemplazo; y una orden judicial permanente para evitar que estos daños vuelvan a ocurrir”.

El registro ha pedido comentarios a OpenAI y actualizará esta historia si recibimos una respuesta sustancial. ®

punto_img

Información más reciente

punto_img