OpenAI bajo la lupa: ¿Modelos de IA entrenados con libros pagos de O’Reilly?

Acusaciones revelan uso de contenido premium en entrenamiento de IA

Un estudio del AI Disclosures Project señala que OpenAI podría haber utilizado libros bajo paywall de O’Reilly Media para entrenar su modelo GPT-4o, según análisis con el método DE-COP diseñado para detectar contenido protegido.

Logotipo de OpenAI con fondo de código binario
Representación visual de los sistemas de IA analizados en el estudio.

Detalles clave de la investigación:

  • Método utilizado: DE-COP, técnica de inferencia para identificar textos protegidos.
  • Muestra analizada: 13,962 fragmentos de 34 libros técnicos de O’Reilly.
  • Resultados contundentes: GPT-4o mostró «reconocimiento significativo» de contenido no público vs. modelos anteriores como GPT-3.5 Turbo.

El informe, coescrito por Tim O’Reilly (CEO de O’Reilly Media) y el economista Ilan Strauss, sugiere que la mejora en el rendimiento de GPT-4o podría relacionarse con el acceso a estos materiales especializados, aunque «no es una prueba definitiva» según los autores.

«GPT-4o demuestra mayor reconocimiento de libros pagos de O’Reilly comparado con modelos anteriores, incluso considerando mejoras técnicas» – Extracto del estudio

Detalle de código binario en fondo de logo OpenAI
Patrones digitales que simbolizan el entrenamiento algorítmico.

Implicaciones legales y éticas

El hallazgo se suma a múltiples demandas contra OpenAI por uso de material protegido, aunque la compañía mantiene acuerdos de licencia con otros proveedores de contenido y mecanismos de exclusión voluntaria.

¿Qué sigue?: Los investigadores no analizaron modelos recientes como GPT-4.5, dejando abierta la pregunta sobre las prácticas actuales de entrenamiento de IA.

Comparte este artículo

Otras notas de tu interés:

Economia

México revisa envíos de petróleo a Cuba ante crecientes tensiones con Estados Unidos

Economia

Donald Trump aborda la crisis del costo de vida en Estados Unidos

Economia

Harvey adquiere Hexus para fortalecer su dominio en el competitivo mercado de IA legal

Tecnologia

Punteros Nulos: El Error de Programación que Puede Colapsar Tus Aplicaciones

Economia

La administración Trump estudia bloqueo naval para cortar el flujo de petróleo a Cuba

Economia

Análisis: La Obsesión de Trump con Groenlandia y sus Consecuencias para EE.UU.

Economia

Discurso Viral de Carney en Davos Complica Diálogo entre Estados Unidos y Canadá

Economia

Capital One adquiere Brex por $5.150 millones, muy por debajo de su máxima valuación

Politica

Microsoft Entrega Claves de Recuperación de BitLocker al FBI en Investigación Federal

Economia

OpenAI y Sam Altman apuestan por India en la cumbre de IA de Nueva Delhi 2026