OpenAI presenta ‘Jalapeño’: su primer chip personalizado de inferencia
El miércoles, OpenAI reveló su primer procesador de inferencia construido a medida, diseñado y fabricado en colaboración con Broadcom. Bautizado como Jalapeño, el nuevo chip fue creado específicamente para las necesidades únicas de los sistemas de inferencia de la compañía. Los propios modelos de IA de OpenAI ayudaron en el desarrollo, según la empresa.
Aunque el chip aún está en fase de pruebas, OpenAI afirma que los primeros resultados muestran un rendimiento por vatio significativamente superior a las alternativas actuales de última generación.
Alianza estratégica con Broadcom
La asociación se anunció oficialmente en octubre, pero los planes de chips de OpenAI han sido objeto de rumores desde hace tiempo como una forma de reducir la dependencia de la compañía de las GPU de Nvidia. Gigantes como Google y Amazon ya han construido chips personalizados con un propósito similar, conocidos como “aceleradores de IA”, diseñados para agilizar las cargas de trabajo de aprendizaje automático.

El presidente de OpenAI, Greg Brockman, explicó el enfoque de la compañía en el desarrollo de chips en su podcast interno, poco después de que se anunciara la alianza con Broadcom.
“Tenemos un profundo conocimiento de la carga de trabajo. Realmente hemos estado buscando cargas de trabajo específicas que no están bien atendidas, preguntándonos cómo podemos construir algo que acelere lo que es posible”, declaró Brockman en el episodio.
Enfoque en la inferencia y el ahorro de costos
Jalapeño está diseñado específicamente para la inferencia, el proceso de ejecutar modelos de IA preentrenados en respuesta a comandos del usuario. En el anuncio, OpenAI destacó el bajo costo operativo del chip al ejecutar modelos de codificación en tiempo real. Es probable que las tareas más intensivas en rendimiento, como el preentrenamiento, sigan dependiendo del hardware de Nvidia, pero incluso pequeñas reducciones en los costos de inferencia podrían mejorar significativamente los resultados financieros de la compañía.
Optimización en toda la pila tecnológica
OpenAI ya está construyendo productos basados en agentes como Codex y los modelos que los impulsan, así como centros de datos para ejecutar esos modelos. Con chips diseñados a medida, la compañía va un paso más allá en ese proceso. Tal como explicó en su anuncio: “OpenAI no solo está desarrollando modelos de frontera o construyendo productos sobre ellos; está diseñando la infraestructura que los sustenta: arquitectura de chips, kernels, sistemas de memoria, redes, planificación, sistemas de despliegue y experiencia de producto. Debido a que OpenAI opera en toda la pila, cada capa puede optimizarse en torno al mismo objetivo: hacer que sus modelos sean más rápidos, fiables y asequibles para los usuarios.”
Con este movimiento, OpenAI refuerza su apuesta por una integración vertical completa, desde el silicio hasta la experiencia del usuario, posicionándose para liderar la próxima generación de inteligencia artificial.