Tecnologia

Portada » Artículos » El Desafío Definitivo: ARC-AGI-2 Pone a Prueba la Verdadera Inteligencia de los Modelos de IA

El Desafío Definitivo: ARC-AGI-2 Pone a Prueba la Verdadera Inteligencia de los Modelos de IA

marzo 31, 2025

¿Pueden las IA Superar este Nuevo Test de Inteligencia General?

La Fundación Arc Prize, cofundada por el investigador de IA François Chollet, ha lanzado el ARC-AGI-2: un test revolucionario que mide la capacidad de razonamiento adaptativo de los modelos de inteligencia artificial. Los primeros resultados son reveladores: sistemas como GPT-4.5 y Claude 3.7 apenas alcanzan el 1% de eficiencia.

Problema tipo del test: identificar patrones en cuadrículas de colores

El Muro de los Modelos de IA

Puntuaciones actuales: 1.3% para sistemas de razonamiento (OpenAI o1-pro)
Comparación humana: 60% de acierto en paneles de 400 personas
Novedad clave: Métrica de eficiencia computacional para evitar soluciones por fuerza bruta

¿Qué Hace Diferente al ARC-AGI-2?

«La inteligencia no se define solo por resolver problemas, sino por la eficiencia al adquirir habilidades»
– Greg Kamradt, cofundador de Arc Prize

El test exige a las IA interpretar patrones nunca vistos, replicando el aprendizaje humano. Un ejemplo claro: mientras el modelo o3 (low) de OpenAI logró 75.7% en ARC-AGI-1, en esta nueva versión solo alcanza 4% con un costo de $200 por tarea.

Arc Prize 2025: El Reto Económico

La fundación lanzó una competencia global con premio millonario: alcanzar 85% de precisión gastando solo $0.42 por tarea. Esto fuerza a los desarrolladores a optimizar no solo la inteligencia, sino también la sostenibilidad económica de los sistemas.

Tags AGI, ARC Prize, François Chollet, IA avanzada, OpenAI, test de inteligencia

Comparte este artículo

Otras notas de tu interés:

Negocios

Estrategias de Escalado para Startups: Agenda del Builders Stage en Disrupt 2026

julio 1, 2026

Economia

La Hipótesis Nula: Clave en el Análisis de Inversiones

julio 1, 2026

Economia

Trump AI Flip Flop: Regalo a China o Propuesta Geopolítica?

julio 1, 2026

Economia

FTC Aprueba la Adquisición de Mesh Optical Technologies por Elon Musk y SpaceX

julio 1, 2026

Negocios

Vinton Cerf, el ‘padre de internet’, se retira de Google

julio 1, 2026

Economia

Wayve ofrece liquidez a empleados con oferta de recompra de $85 millones a valoración de $8.5 mil millones

julio 1, 2026

Economia

Trump levanta restricciones a los modelos de IA Mythos y Fable de Anthropic

julio 1, 2026

Tecnologia

Busy Bar de Flipper Devices: El display de productividad personalizable que llega para transformar tu enfoque

julio 1, 2026

Tecnologia

OpenClaw llega a iOS y Android: el agente de IA de código abierto ahora es una app móvil

junio 30, 2026

Economia

EquiLibre Technologies: La IA de DeepMind que venció al póker ahora conquista Wall Street

junio 30, 2026