Google DeepMind Project Genie: IA para crear mundos de juego interactivos

DeepMind abre el acceso a su herramienta experimental para generar entornos interactivos

Google DeepMind ha iniciado el acceso a Project Genie, su herramienta de inteligencia artificial que permite crear mundos de juegos interactivos a partir de prompts de texto o imágenes. Esta innovación se ofrece como un prototipo de investigación experimental.

Disponibilidad y tecnología detrás de Project Genie

A partir de este jueves, los suscriptores de Google AI Ultra en Estados Unidos pueden experimentar con Project Genie. El sistema está impulsado por una combinación del modelo de mundo Genie 3, el modelo de generación de imágenes Nano Banana Pro y Gemini.

Este lanzamiento llega cinco meses después de la vista previa de investigación de Genie 3 y forma parte de un esfuerzo más amplio para recopilar comentarios de usuarios y datos de entrenamiento, mientras DeepMind acelera el desarrollo de modelos de mundo más capaces.

Modelos de mundo: un paso crucial hacia la AGI

Los modelos de mundo son sistemas de IA que generan una representación interna de un entorno y pueden usarse para predecir resultados futuros y planificar acciones. Muchos líderes en IA, incluidos los de DeepMind, creen que estos modelos son un paso crucial para lograr la inteligencia artificial general (AGI).

A corto plazo, laboratorios como DeepMind visualizan un plan de comercialización que comienza con videojuegos y otras formas de entretenimiento, para luego extenderse al entrenamiento de agentes encarnados (robots) en simulación.

La competencia se intensifica

El lanzamiento de Project Genie ocurre mientras la carrera por los modelos de mundo comienza a calentarse. World Labs de Fei-Fei Li lanzó a fines del año pasado su primer producto comercial llamado Marble. Runway, la startup de generación de video con IA, también ha lanzado recientemente un modelo de mundo. Y la startup AMI Labs del ex científico jefe de Meta, Yann LeCun, también se centrará en desarrollar modelos de mundo.

Un prototipo experimental con grandes ambiciones

«Creo que es emocionante estar en un lugar donde podemos que más personas accedan a ello y nos den su feedback», dijo Shlomi Fruchter, director de investigación de DeepMind, en una entrevista.

Los investigadores de DeepMind fueron claros sobre la naturaleza experimental de la herramienta. Puede ser inconsistente: a veces genera mundos jugables de manera impresionante, otras veces produce resultados desconcertantes.

Cómo funciona Project Genie

El proceso comienza con un «bosquejo del mundo», proporcionando prompts de texto para el entorno y un personaje principal. Nano Banana Pro crea una imagen basada en los prompts que, en teoría, puedes modificar antes de que Genie use la imagen como punto de partida para un mundo interactivo.

También puedes usar fotografías reales como base para que el modelo construya un mundo, aunque esto fue variable en éxito.

Una vez satisfecho con la imagen, Project Genie tarda unos segundos en crear un mundo explorable. Puedes remezclar mundos existentes en nuevas interpretaciones, explorar mundos curados en la galería o usar la herramienta aleatoria para inspiración. Luego puedes descargar videos del mundo explorado.

Limitaciones actuales y restricciones de seguridad

DeepMind solo permite 60 segundos de generación y navegación por mundo, en parte debido a restricciones de presupuesto y capacidad computacional. Fruchter explicó que extenderlo más allá de 60 segundos disminuiría el valor incremental de las pruebas.

Las barreras de seguridad ya están activas: no se puede generar nada que se asemeje a desnudos, ni mundos que remotamente huelan a Disney u otro material con derechos de autor. Incluso intentos de generar mundos de sirenas o reinas de hielo fueron bloqueados.

Impresiones y desafíos en la experiencia de uso

La demostración fue profundamente impresionante. En un ejemplo, se generó un mundo de un castillo en las nubes hecho de malvaviscos, con un río de salsa de chocolate y árboles de caramelo, en estilo claymation.

Sin embargo, Project Genie aún tiene algunos problemas por resolver. Los modelos sobresalían en crear mundos basados en prompts artísticos (acuarelas, estilo anime, estética de dibujos animados clásicos), pero tendían a fallar en mundos fotorrealistas o cinemáticos, a menudo pareciendo un videojuego en lugar de un entorno real.

La interactividad también es un área de mejora: hubo ocasiones en que los personajes atravesaban paredes u objetos sólidos. La navegación con las teclas W-A-S-D y flechas a veces era no responsiva o enviaba en la dirección incorrecta.

El futuro de Project Genie

Fruchter aseguró que su equipo es consciente de estas deficiencias y recuerda que Project Genie es un prototipo experimental. En el futuro, el equipo espera mejorar el realismo y las capacidades de interacción, incluido dar a los usuarios más control sobre las acciones y entornos.

«No pensamos en [Project Genie] como un producto integral al que la gente pueda volver todos los días, pero creemos que ya hay un vistazo de algo interesante y único que no se puede hacer de otra manera», dijo.

Comparte este artículo

Otras notas de tu interés:

Espectáculos y Entretenimiento

Burger Marty, el enmascarado del compás, llega al Festival de Compas Haitiano

Negocios

Elon Musk contra OpenAI y Sam Altman: el juicio que podría redefinir el futuro de la inteligencia artificial

Negocios

SpaceXAI pierde a más de 50 talentos: la fuga de cerebros que sacude a la compañía de Elon Musk

Tecnologia

OpenAI Codex llega a dispositivos móviles: integración en iOS y Android

Economia

OpenAI contra Apple: acciones legales por la integración fallida de ChatGPT

Negocios

OpenAI considera acciones legales contra Apple por fallida integración de ChatGPT

Economia

Recursive Superintelligence: La startup de Richard Socher que busca la auto-mejora recursiva de la IA

Espectáculos y Entretenimiento

Spotify celebra 20 años con un ‘Recap’ histórico para sus usuarios

Economia

Elon Musk Considera Comprar una Mansión en Miami Beach: ¿El Nuevo Vecino de los Millonarios?

Economia

Khosla Ventures invierte $10 millones en Synthetic: la startup de contabilidad autónoma de Ian Crosby