El Desafío Definitivo: ARC-AGI-2 Pone a Prueba la Verdadera Inteligencia de los Modelos de IA

¿Pueden las IA Superar este Nuevo Test de Inteligencia General?

La Fundación Arc Prize, cofundada por el investigador de IA François Chollet, ha lanzado el ARC-AGI-2: un test revolucionario que mide la capacidad de razonamiento adaptativo de los modelos de inteligencia artificial. Los primeros resultados son reveladores: sistemas como GPT-4.5 y Claude 3.7 apenas alcanzan el 1% de eficiencia.

Ejemplo de problema visual ARC-AGI-2

Problema tipo del test: identificar patrones en cuadrículas de colores

El Muro de los Modelos de IA

  • Puntuaciones actuales: 1.3% para sistemas de razonamiento (OpenAI o1-pro)
  • Comparación humana: 60% de acierto en paneles de 400 personas
  • Novedad clave: Métrica de eficiencia computacional para evitar soluciones por fuerza bruta

Comparación histórica de tests ARC-AGI

¿Qué Hace Diferente al ARC-AGI-2?

«La inteligencia no se define solo por resolver problemas, sino por la eficiencia al adquirir habilidades»
Greg Kamradt, cofundador de Arc Prize

El test exige a las IA interpretar patrones nunca vistos, replicando el aprendizaje humano. Un ejemplo claro: mientras el modelo o3 (low) de OpenAI logró 75.7% en ARC-AGI-1, en esta nueva versión solo alcanza 4% con un costo de $200 por tarea.

Arc Prize 2025: El Reto Económico

La fundación lanzó una competencia global con premio millonario: alcanzar 85% de precisión gastando solo $0.42 por tarea. Esto fuerza a los desarrolladores a optimizar no solo la inteligencia, sino también la sostenibilidad económica de los sistemas.

Comparte este artículo

Otras notas de tu interés:

Economia

El boom de la IA en Silicon Valley: una brecha de riqueza y empleo que divide a la industria

Sociedad y Cultura

arXiv endurece políticas: prohibición de un año por uso descuidado de IA en artículos científicos

Politica

Sean Cairncross y el liderazgo en el control de la IA avanzada: nuevas preocupaciones cibernéticas

Economia

El auge de los centros de datos AI en South Florida: crecimiento y polémica vecinal

Negocios

Greg Brockman asume el control de la estrategia de producto en OpenAI

Politica Internacional

Estados Unidos ordena a viajeros en Air Force One desechar regalos y teléfonos tras viaje a China

Economia

Crecimiento de centros de datos para IA en South Florida: ¿Progreso tecnológico o peligro ambiental y comunitario?

Politica

La Cámara de Representantes busca bloquear leyes estatales de IA en California y Nueva York

Economia

Crisis energética en Silicon Valley y Lake Tahoe: el impacto de los centros de datos y la IA

Economia

OpenAI y Plaid unen fuerzas: finanzas personales con inteligencia artificial para suscriptores Pro