El Desafío Definitivo: ARC-AGI-2 Pone a Prueba la Verdadera Inteligencia de los Modelos de IA

¿Pueden las IA Superar este Nuevo Test de Inteligencia General?

La Fundación Arc Prize, cofundada por el investigador de IA François Chollet, ha lanzado el ARC-AGI-2: un test revolucionario que mide la capacidad de razonamiento adaptativo de los modelos de inteligencia artificial. Los primeros resultados son reveladores: sistemas como GPT-4.5 y Claude 3.7 apenas alcanzan el 1% de eficiencia.

Ejemplo de problema visual ARC-AGI-2

Problema tipo del test: identificar patrones en cuadrículas de colores

El Muro de los Modelos de IA

  • Puntuaciones actuales: 1.3% para sistemas de razonamiento (OpenAI o1-pro)
  • Comparación humana: 60% de acierto en paneles de 400 personas
  • Novedad clave: Métrica de eficiencia computacional para evitar soluciones por fuerza bruta

Comparación histórica de tests ARC-AGI

¿Qué Hace Diferente al ARC-AGI-2?

«La inteligencia no se define solo por resolver problemas, sino por la eficiencia al adquirir habilidades»
Greg Kamradt, cofundador de Arc Prize

El test exige a las IA interpretar patrones nunca vistos, replicando el aprendizaje humano. Un ejemplo claro: mientras el modelo o3 (low) de OpenAI logró 75.7% en ARC-AGI-1, en esta nueva versión solo alcanza 4% con un costo de $200 por tarea.

Arc Prize 2025: El Reto Económico

La fundación lanzó una competencia global con premio millonario: alcanzar 85% de precisión gastando solo $0.42 por tarea. Esto fuerza a los desarrolladores a optimizar no solo la inteligencia, sino también la sostenibilidad económica de los sistemas.

Comparte este artículo

Otras notas de tu interés:

Negocios

Estrategias de Escalado para Startups: Agenda del Builders Stage en Disrupt 2026

Economia

La Hipótesis Nula: Clave en el Análisis de Inversiones

Economia

Trump AI Flip Flop: Regalo a China o Propuesta Geopolítica?

Economia

FTC Aprueba la Adquisición de Mesh Optical Technologies por Elon Musk y SpaceX

Negocios

Vinton Cerf, el ‘padre de internet’, se retira de Google

Economia

Wayve ofrece liquidez a empleados con oferta de recompra de $85 millones a valoración de $8.5 mil millones

Economia

Trump levanta restricciones a los modelos de IA Mythos y Fable de Anthropic

Tecnologia

Busy Bar de Flipper Devices: El display de productividad personalizable que llega para transformar tu enfoque

Tecnologia

OpenClaw llega a iOS y Android: el agente de IA de código abierto ahora es una app móvil

Economia

EquiLibre Technologies: La IA de DeepMind que venció al póker ahora conquista Wall Street