La startup que organiza el caos de datos visuales para construir las máquinas autónomas del futuro
Desarrollar coches sin conductor, robots que interactúan con el entorno o equipos de construcción autónomos genera una avalancha de datos: miles, incluso millones, de horas de video que deben ser evaluadas y utilizadas para entrenar a los modelos de inteligencia artificial. Actualmente, organizar y catalogar estos videos es una tarea que recae en humanos, un proceso que no escala. La startup NomadicML ha anunciado una ronda de financiación semilla de $8.4 millones para resolver este cuello de botella crítico.

Del archivo inútil al dataset accionable
El gran desafío, según los fundadores de NomadicML, es que hasta el 95% de los datos de las flotas permanecen en archivos sin utilizar. Lo más valioso son los «casos extremos» –eventos raros que confunden a los modelos de IA–, pero encontrarlos manualmente es como buscar una aguja en un pajar. La plataforma de Nomadic convierte las secuencias de video en un conjunto de datos estructurado y busqueda mediante modelos de lenguaje visual, permitiendo un mejor monitoreo de flotas y la creación de datasets únicos para aprendizaje por refuerzo.
Una ronda de financiación que valida el enfoque
La ronda semilla, anunciada un martes, valora a la compañía en $50 millones post-dinero. Fue liderada por TQ Ventures, con participación de Pear VC y Jeff Dean, y permitirá a la startup incorporar más clientes y refinar su plataforma. El reconocimiento no termina ahí: NomadicML también ganó el primer premio en el concurso de pitches de Nvidia GTC el mes pasado.
Los cerebros detrás de la operación
Los cofundadores Mustafa Bal (CEO) y Varun Krishnan (CTO) se conocieron como estudiantes de informática en Harvard. «Seguíamos encontrando los mismos desafíos técnicos una y otra vez en nuestros trabajos» en empresas como Lyft y Snowflake, explicó Bal. Krishnan, además, es un maestro internacional de ajedrez, y Bal destaca que la docena de ingenieros de la empresa han publicado artículos científicos.

Clientes y casos de uso en el mundo real
La plataforma ya es utilizada por empresas como Zoox, Mitsubishi Electric, Natix Network y Zendar. Antonio Puglielli, VP de Ingeniería en Zendar, afirmó que la herramienta de Nomadic permitió a su empresa escalar su trabajo mucho más rápido que con la externalización, y que su experiencia en el dominio la diferencia de la competencia.
Más que un simple etiquetador automático
Mientras empresas establecidas como Scale, Kognic y Encord desarrollan herramientas de IA para la anotación automática, y Nvidia lanza modelos de código abierto como Alpamayo, NomadicML afirma que su herramienta va más allá. Varun Krishnan la describe como un «sistema de razonamiento agéntico: describes lo que necesitas y él descubre cómo encontrarlo», utilizando múltiples modelos para entender las acciones y ponerlas en contexto.
«Es la misma razón por la que Salesforce no construye su propia nube y Netflix no construye sus propias instalaciones de distribución de contenido», explicó Schuster Tanger, socio de TQ Ventures. «En el momento en que una empresa de vehículos autónomos intenta construir Nomadic internamente, se distrae de lo que la hace ganar, que es el robot en sí».
El próximo desafío: ir más allá del video
El equipo ahora trabaja en herramientas específicas, como una que entiende la física de los cambios de carril a partir de imágenes, o otra que localiza con precisión las pinzas de un robot en un video. El siguiente gran reto es desarrollar herramientas similares para datos no visuales, como lecturas de sensores lidar, e integrar datos de sensores multimodales.
«Manejar terabytes de video, procesarlos con cientos de modelos de más de 100 mil millones de parámetros y luego extraer información precisa es realmente increíblemente difícil», admitió Bal. Con su nueva financiación, NomadicML está lista para simplificar esa complejidad y acelerar la llegada de la autonomía.