Revolución en IA: Genie 3 de DeepMind

Google DeepMind ha presentado Genie 3, su último modelo fundacional que entrena agentes de IA de propósito general. Según el laboratorio, esta capacidad representa un escalón crucial hacia la inteligencia artificial general (AGI), equivalente a la inteligencia humana.
Capacidades sin precedentes
Genie 3 es el primer modelo mundial interactivo en tiempo real de propósito general, según Shlomi Fruchter, director de investigación de DeepMind. Supera modelos anteriores al generar mundos fotorrealistas e imaginarios sin limitarse a entornos específicos.

- Generación: Crea minutos de entornos 3D interactivos en 720p a 24 fps
- Innovación: Eventos mundiales modificables mediante prompts
- Consistencia física: Memoria autónoma para mantener coherencia en simulaciones
Camino hacia la AGI
El modelo, aún en fase de investigación, combina tecnologías de Genie 2 y Veo 3. Su arquitectura autorregresiva genera fotogramas secuencialmente, recordando lo creado previamente para decidir siguientes acciones.
Jack Parker-Holder, científico de DeepMind, destaca:
«Los modelos mundiales son clave para la AGI, especialmente para agentes incorporados donde simular escenarios reales es complejo»
Pruebas y limitaciones

En pruebas con el agente SIMA, Genie 3 permitió lograr objetivos como «acercarse al compactador de basura verde» en entornos simulados. Sin embargo, presenta limitaciones:
- Física imperfecta (ej: movimiento de nieve en esquí)
- Acciones limitadas para agentes
- Dificultad para modelar interacciones complejas entre múltiples agentes
- Duración máxima de pocos minutos por sesión
A pesar de esto, Genie 3 representa un avance significativo hacia agentes capaces de planificar, explorar y aprender mediante prueba y error, acercándonos a la ansiada inteligencia artificial general.