Sign In

OpenAI bajo la lupa: ¿Modelos de IA entrenados con libros pagos de O’Reilly?

Acusaciones revelan uso de contenido premium en entrenamiento de IA

Un estudio del AI Disclosures Project señala que OpenAI podría haber utilizado libros bajo paywall de O’Reilly Media para entrenar su modelo GPT-4o, según análisis con el método DE-COP diseñado para detectar contenido protegido.

Logotipo de OpenAI con fondo de código binario
Representación visual de los sistemas de IA analizados en el estudio.

Detalles clave de la investigación:

  • Método utilizado: DE-COP, técnica de inferencia para identificar textos protegidos.
  • Muestra analizada: 13,962 fragmentos de 34 libros técnicos de O’Reilly.
  • Resultados contundentes: GPT-4o mostró «reconocimiento significativo» de contenido no público vs. modelos anteriores como GPT-3.5 Turbo.

El informe, coescrito por Tim O’Reilly (CEO de O’Reilly Media) y el economista Ilan Strauss, sugiere que la mejora en el rendimiento de GPT-4o podría relacionarse con el acceso a estos materiales especializados, aunque «no es una prueba definitiva» según los autores.

«GPT-4o demuestra mayor reconocimiento de libros pagos de O’Reilly comparado con modelos anteriores, incluso considerando mejoras técnicas» – Extracto del estudio

Detalle de código binario en fondo de logo OpenAI
Patrones digitales que simbolizan el entrenamiento algorítmico.

Implicaciones legales y éticas

El hallazgo se suma a múltiples demandas contra OpenAI por uso de material protegido, aunque la compañía mantiene acuerdos de licencia con otros proveedores de contenido y mecanismos de exclusión voluntaria.

¿Qué sigue?: Los investigadores no analizaron modelos recientes como GPT-4.5, dejando abierta la pregunta sobre las prácticas actuales de entrenamiento de IA.

Comparte este artículo

Otras notas de tu interés:

Negocios

Google anuncia el fin del soporte para termostatos Nest: ¿Qué deben saber los usuarios?

Negocios

La ‘Mafia OpenAI’: 15 startups revolucionarias fundadas por sus exalumnos

Economia

a16z Apuesta Fuerte por el Fundador de WeWork: Adam Neumann Lanza Flow con Millonario Respaldo

Negocios

Claude AI de Anthropic Ahora Puede Escribir y Ejecutar Código JavaScript: Revolución en el Análisis de Datos

Sociedad y Cultura

OpenAI pone a prueba la persuasión de su IA en el subreddit r/ChangeMyView: ¿Qué revelan los últimos hallazgos?

Sociedad y Cultura

Trabajadores de Google DeepMind en Londres Buscan Sindicarse ante Preocupaciones Éticas en IA

Economia

Trump y aliados lanzan club exclusivo para millonarios en Washington

Economia

Slate Auto elige fábrica de Indiana para producir su camioneta eléctrica accesible

Economia

Robert F. Kennedy Jr.: El eje de la agenda doméstica de Trump para consolidar el poder republicano

Economia

Elon Musk busca recaudar $20 mil millones para xAI Holdings: ¿La próxima revolución en inteligencia artificial?