Negocios, Tecnologia

Portada » Artículos » OpenAI enfrenta un desafío crítico: los nuevos modelos o3 y o4-mini presentan altas tasas de alucinaciones

OpenAI enfrenta un desafío crítico: los nuevos modelos o3 y o4-mini presentan altas tasas de alucinaciones

abril 18, 2025

Los modelos de razonamiento avanzado muestran retroceso en precisión

Los nuevos modelos de inteligencia artificial o3 y o4-mini de OpenAI, diseñados para tareas complejas de razonamiento, están generando preocupación por su tendencia a «alucinar» con mayor frecuencia que versiones anteriores.

Esquema comparativo de modelos de lenguaje de OpenAI (Fuente: Documentación técnica)

Datos alarmantes en pruebas internas

o3 mostró 33% de alucinaciones en PersonQA
o4-mini alcanzó un preocupante 48%
Modelos anteriores como o1-mini mantenían tasas de <14.8%

Hallazgos externos reveladores

La organización Transluce documentó casos donde o3 inventaba procesos inexistentes, como ejecutar código en hardware específico. «El aprendizaje por refuerzo podría estar amplificando estos errores», señaló Neil Chowdhury, investigador de Transluce.

Impacto en aplicaciones prácticas

Kian Katanforoosh de Workera advierte:

«Aunque supera a la competencia en programación, o3 genera enlaces rotos con frecuencia»

¿Solución en el horizonte?

OpenAI explora integración con búsquedas web, demostrando 90% de precisión en GPT-4o para consultas simples. Sin embargo, esta solución requiere compartir datos con terceros.

El dilema del progreso tecnológico

Mientras la industria apuesta por modelos de razonamiento para evitar escalar recursos computacionales, el aumento de alucinaciones plantea un obstáculo crítico para aplicaciones empresariales sensibles.

Tags alucinaciones, ChatGPT, GPT-4o, IA, modelos de razonamiento, OpenAI, Transluce

Comparte este artículo

Otras notas de tu interés:

Guía de Compras y Compradores

Fresh Market abre su segunda tienda en Aventura: más grande y con nuevas experiencias gourmet

febrero 13, 2026

Politica Internacional

War Game: Simulamos un Ataque Ruso a la OTAN

febrero 13, 2026

Economia

Monaco AI: La Revolución de la IA en Ventas con $35 Millones en Fondos

febrero 13, 2026

Economia

Renuncia la abogada general de Goldman Sachs por vínculos con Epstein

febrero 13, 2026

Negocios

La IA en Startups y Sistemas Empresariales: Un Momento Decisivo para Emprender

febrero 13, 2026

Tecnologia

Threads lanza ‘Dear Algo’: Personaliza tu feed con IA mediante un simple post

febrero 13, 2026

Negocios

Elon Musk y el sueño de los data centers orbitales: costos y desafíos fuera de este mundo

febrero 13, 2026

Economia

Depuración estratégica: Elon Musk reestructura xAI tras la salida masiva de cofundadores y talento clave

febrero 13, 2026

Negocios

¿Quién Poseerá la Capa de IA en las Soluciones Empresariales?

febrero 13, 2026

Guía de Compras y Compradores

Uber Eats revoluciona las compras con Cart Assistant: tu nuevo asistente de IA para el supermercado

febrero 13, 2026