Estudio Revela que OpenAI Memorizó Contenido Protegido por Derechos de Autor

¿OpenAI Usó Libros y Artículos Protegidos para Entrenar sus Modelos?

Un estudio reciente de las universidades de Washington, Copenhague y Stanford reveló que GPT-4 y GPT-3.5 mostraron capacidad para «recordar» fragmentos de libros populares y artículos de The New York Times, reforzando las demandas por uso ilegal de contenido protegido.

Dispositivo móvil con logo de ChatGPT

El Método de los «Términos Sorprendentes»

  • Los investigadores eliminaron palabras estadísticamente improbables (como «radar» en una oración) y pidieron a los modelos completarlas.
  • Si los modelos acertaban, se infería que memorizaron el texto durante su entrenamiento.

Según los resultados, GPT-4 identificó correctamente fragmentos de libros incluidos en el conjunto de datos BookMIA, que contiene muestras de ebooks bajo derechos de autor.

Implicaciones Legales y Transparencia

Debate sobre derechos de autor y OpenAI

Abhilasha Ravichander, coautora del estudio, destacó:

«Para tener modelos confiables, necesitamos poder auditarlos científicamente. Hay una necesidad urgente de transparencia en los datos»

OpenAI mantiene su postura de «uso justo» bajo la ley estadounidense, aunque enfrenta demandas de autores y programadores que exigen compensación por el uso de sus obras.

¿Qué Sigue?

  • La compañía ha impulsado regulaciones que flexibilicen el uso de datos protegidos para IA.
  • Ofrece mecanismos para que creadores excluyan su contenido, pero críticos argumentan que es insuficiente.

Comparte este artículo

Otras notas de tu interés:

Espectáculos y Entretenimiento

OpenAI adquiere el talk show TBPN: un movimiento estratégico en medios e inteligencia artificial

Negocios

Null en Programación: Entendiendo los Errores que Pueden Colapsar tu Software

Espectáculos y Entretenimiento

NASA y SpaceX: Misión histórica a la Luna con Artemis II

Negocios

Anthropic provoca eliminación masiva en GitHub tras filtración accidental de su código fuente

Sostenibilidad y Medio Ambiente

Meta Financia Plantas de Gas Natural para su Centro de Datos de IA, Aumentando su Huella de Carbono

Economia

Cognichip Recauda $60 Millones para Revolucionar el Diseño de Chips con IA

Noticia Local

Artemis II Despega Hoy: Claves para Ver el Lanzamiento desde Florida

Espectáculos y Entretenimiento

Artemis II Despega Hoy: Fecha, Hora y Cómo Ver el Lanzamiento desde Florida

Negocios

StrictlyVC Llega a San Francisco: Un Evento Imperdible para Startups e Inversores

Economia

Organización Sin Fines de Lucro Propone a Gigantes Tecnológicos Pagar 100 Millones de Dólares Cada Uno por Seguridad en IA