Runway Se Suma a la Carrera de los Modelos de Mundo con GWM-1
La compañía de generación de imágenes y video mediante inteligencia artificial, Runway, ha lanzado su primer modelo de mundo, denominado GWM-1. Este sistema funciona mediante la predicción fotograma a fotograma, creando una simulación que comprende la física y cómo se comporta el mundo real a lo largo del tiempo.
¿Qué es un World Model o Modelo de Mundo?
Un world model es un sistema de IA que aprende una simulación interna de cómo funciona el mundo, permitiéndole razonar, planificar y actuar sin necesidad de ser entrenado en cada escenario posible de la vida real.
Las Tres Versiones Especializadas de GWM-1
Runway ha lanzado versiones específicas de su nuevo modelo de mundo: GWM-Worlds, GWM-Robotics y GWM-Avatars.
GWM-Worlds: Creando Mundos Interactivos
Esta es una aplicación del modelo que permite crear un proyecto interactivo. Los usuarios pueden establecer una escena mediante un prompt o una referencia de imagen, y mientras exploran el espacio, el modelo genera el mundo con comprensión de la geometría, física e iluminación. La simulación se ejecuta a 24 fps y resolución de 720p. Runway menciona que, si bien Worlds podría ser útil para videojuegos, también está bien posicionado para enseñar a agentes cómo navegar y comportarse en el mundo físico.
GWM-Robotics: Entrenamiento con Datos Sintéticos
Con GWM-Robotics, la compañía pretende utilizar datos sintéticos enriquecidos con nuevos parámetros, como condiciones climáticas cambiantes u obstáculos. Este método también podría revelar cuándo y cómo los robots podrían violar políticas e instrucciones en diferentes escenarios.
GWM-Avatars: Simulando Comportamiento Humano
Runway también está construyendo avatares realistas bajo GWM-Avatars para simular el comportamiento humano. Compañías como D-ID, Synthesia, Soul Machines e incluso Google han trabajado en la creación de avatares humanos que parezcan reales y funcionen en áreas como la comunicación y la formación.

Técnicamente, Worlds, Robotics y Avatars son modelos separados, pero eventualmente Runway planea fusionarlos en un solo modelo.
Actualización del Modelo Fundacional Gen 4.5
Además del nuevo modelo de mundo, Runway también actualiza su modelo fundacional Gen 4.5, lanzado a principios de mes. La nueva actualización aporta capacidades de audio nativo y generación de formato largo y multi-escena al modelo. Con este modelo, los usuarios pueden generar videos de un minuto con consistencia de personajes, diálogo nativo, audio de fondo y tomas complejas desde varios ángulos. También se puede editar audio existente y agregar diálogos, además de editar videos multi-escena de cualquier longitud.
Competencia y el Futuro de la Generación de Video
La actualización de Gen 4.5 acerca a Runway al competidor Kling y su suite integral de video, particularmente en torno al audio nativo y la narrativa multi-escena. Esto también señala que los modelos de generación de video están pasando de ser prototipos a herramientas listas para producción. El modelo Gen 4.5 actualizado de Runway está disponible para todos los usuarios de planes de pago.
La compañía afirmó que pondrá GWM-Robotics a disposición a través de un SDK y que está en conversaciones activas con varias empresas de robótica y corporaciones para el uso de GWM-Robotics y GWM-Avatars.