Estudio Revela que OpenAI Memorizó Contenido Protegido por Derechos de Autor

¿OpenAI Usó Libros y Artículos Protegidos para Entrenar sus Modelos?

Un estudio reciente de las universidades de Washington, Copenhague y Stanford reveló que GPT-4 y GPT-3.5 mostraron capacidad para «recordar» fragmentos de libros populares y artículos de The New York Times, reforzando las demandas por uso ilegal de contenido protegido.

Dispositivo móvil con logo de ChatGPT

El Método de los «Términos Sorprendentes»

  • Los investigadores eliminaron palabras estadísticamente improbables (como «radar» en una oración) y pidieron a los modelos completarlas.
  • Si los modelos acertaban, se infería que memorizaron el texto durante su entrenamiento.

Según los resultados, GPT-4 identificó correctamente fragmentos de libros incluidos en el conjunto de datos BookMIA, que contiene muestras de ebooks bajo derechos de autor.

Implicaciones Legales y Transparencia

Debate sobre derechos de autor y OpenAI

Abhilasha Ravichander, coautora del estudio, destacó:

«Para tener modelos confiables, necesitamos poder auditarlos científicamente. Hay una necesidad urgente de transparencia en los datos»

OpenAI mantiene su postura de «uso justo» bajo la ley estadounidense, aunque enfrenta demandas de autores y programadores que exigen compensación por el uso de sus obras.

¿Qué Sigue?

  • La compañía ha impulsado regulaciones que flexibilicen el uso de datos protegidos para IA.
  • Ofrece mecanismos para que creadores excluyan su contenido, pero críticos argumentan que es insuficiente.

Comparte este artículo

Otras notas de tu interés:

Negocios

Amazon Alexa+ lanza podcasts generados por IA: crea episodios personalizados en minutos

Negocios

LetinAR: La startup surcoreana que impulsa las gafas inteligentes con su tecnología óptica PinTILT

Economia

La IA transforma la industria automotriz: GM elimina 600 empleos de TI y contrata expertos en inteligencia artificial

Sociedad y Cultura

Estudiantes abuchean discursos sobre inteligencia artificial en ceremonias de graduación 2026

Tecnologia

El Jailbreaking de Kindle se Dispara ante el Fin del Soporte de Amazon

Economia

Cerebras: El Camino Casi Fatal Hacia el Chip de IA Más Grande del Mundo

Bienestar y Salud Mental

Isa: El Dispositivo que Mejora la Postura en el Escritorio sin Cámara

Deportes

Carrera Contrarreloj para Proteger la Copa Mundial de los Drones

Economia

El boom de la IA en Silicon Valley: una brecha de riqueza y empleo que divide a la industria

Sociedad y Cultura

arXiv endurece políticas: prohibición de un año por uso descuidado de IA en artículos científicos