XDOF emerge con 70 millones de dólares para resolver el cuello de botella de datos en robótica
El auge de la inteligencia artificial ha llevado a los principales laboratorios a competir por enseñar a las máquinas a operar en el mundo físico. Sin embargo, la robótica se enfrenta a un desafío crucial: la falta de datos de entrenamiento de alta calidad. XDOF (pronunciado “ecks-doff”) sale hoy del modo sigiloso con una propuesta para cerrar esa brecha, respaldada por una ronda de financiación de 70 millones de dólares de Thrive Capital, Spark Capital, a16z, Lux y WndrCo.
La startup, fundada en octubre de 2024 por Philippe Wu, Fred Shentu y Nemo Jin, cuenta con unos 60 empleados y ya trabaja con 20 clientes, incluidos varios laboratorios de IA de frontera. Su objetivo: crear las tuberías de datos, herramientas de recolección y sistemas de anotación que las empresas de robótica no pueden construir fácilmente por sí mismas.
El origen de XDOF
Wu, quien era estudiante de doctorado en UC Berkeley, se enfrentó al problema de la falta de datos a gran escala para entrenar robots. “No teníamos datos a gran escala con los que trabajar”, explica. “Había un problema de huevo y gallina: primero necesitábamos recolectar datos antes de siquiera preguntarnos cómo entrenar un modelo fundacional para robótica”.
Junto con Shentu, desarrolló GELLO, un sistema de teleoperación de bajo costo que permite a un operador humano controlar un brazo robótico para generar datos de entrenamiento. El proyecto se convirtió en un artículo influyente en robótica, y muchos comenzaron a aprovechar este tipo de dispositivo para la recolección de datos.
El conjunto de datos ABC: un hito académico
Como punto de partida, XDOF se asoció con el laboratorio de investigación de IA de UC Berkeley para lanzar lo que consideran la mayor colección de datos de entrenamiento robótico de alta calidad jamás ensamblada, denominada ABC. Incluye 130.000 trayectorias de datos de manipulación robótica, 300 horas de simulación y 100 horas de evaluaciones. Este tipo de datos de preentrenamiento a gran escala nunca antes había estado disponible para la academia.
David McAllister, estudiante de doctorado en Berkeley que ayudó a organizar el lanzamiento, señala: “Hemos visto en lenguaje, generación de imágenes y otros campos que cuando se publican modelos y datos, la comunidad logra cosas que no necesariamente se esperaban”.

La pirámide de datos de XDOF
La compañía planea trabajar en tres niveles de una pirámide de datos:
- Nivel más valioso: Datos de teleoperación recolectados en el robot real que se está desplegando.
- Segundo nivel: Robots teleoperados que reúnen datos más generales, como con GELLO.
- Tercer nivel: Datos “egocéntricos” recopilados por humanos que realizan tareas cotidianas, para lo cual XDOF planea construir sus propios sensores portátiles.
“La elección de la cámara afectará la calidad de sus datos, lo que afectará el rendimiento de su algoritmo de seguimiento de manos”, afirma Wu. “Si no diseñas bien el hardware desde el principio, los datos que recopiles pueden tener problemas muy específicos que no anticipaste”.
Un modelo intensivo en mano de obra
XDOF planea contratar y entrenar ejércitos de teleoperadores y operadores de datos egocéntricos en todo el mundo. ¿Por qué los grandes laboratorios no hacen este trabajo ellos mismos? “Necesitas un almacén de cientos de miles de pies cuadrados con cientos de robots”, explica Wu. “Necesitas mantener estos robots, calibrar sus parámetros físicos y entrenar adecuadamente a los operadores”.
Es una construcción que requiere enfoque, capital y escala operativa que la mayoría de los laboratorios de IA preferirían subcontratar, y ese es precisamente el mercado en el que apuesta XDOF.

El significado del nombre XDOF
El nombre XDOF es un juego con el término robótico “grados de libertad” (degrees of freedom), que describe el número de movimientos independientes que un robot puede realizar. El brazo humano tiene siete grados de libertad. El robot humanoide de Figure.AI tiene 30. La “X” en el nombre captura la ambición: “Grados de libertad arbitrarios, grados de libertad ilimitados”, dice Wu.
