¿Pueden las IA Superar este Nuevo Test de Inteligencia General?
La Fundación Arc Prize, cofundada por el investigador de IA François Chollet, ha lanzado el ARC-AGI-2: un test revolucionario que mide la capacidad de razonamiento adaptativo de los modelos de inteligencia artificial. Los primeros resultados son reveladores: sistemas como GPT-4.5 y Claude 3.7 apenas alcanzan el 1% de eficiencia.
El Muro de los Modelos de IA
- Puntuaciones actuales: 1.3% para sistemas de razonamiento (OpenAI o1-pro)
- Comparación humana: 60% de acierto en paneles de 400 personas
- Novedad clave: Métrica de eficiencia computacional para evitar soluciones por fuerza bruta
¿Qué Hace Diferente al ARC-AGI-2?
«La inteligencia no se define solo por resolver problemas, sino por la eficiencia al adquirir habilidades»
– Greg Kamradt, cofundador de Arc Prize
El test exige a las IA interpretar patrones nunca vistos, replicando el aprendizaje humano. Un ejemplo claro: mientras el modelo o3 (low) de OpenAI logró 75.7% en ARC-AGI-1, en esta nueva versión solo alcanza 4% con un costo de $200 por tarea.
Arc Prize 2025: El Reto Económico
La fundación lanzó una competencia global con premio millonario: alcanzar 85% de precisión gastando solo $0.42 por tarea. Esto fuerza a los desarrolladores a optimizar no solo la inteligencia, sino también la sostenibilidad económica de los sistemas.