Crisis de Presupuesto en IA: Empresas Luchan por Controlar Costos de Tokens

Explosión de Consumo de Tokens Desata una Crisis Presupuestaria

En toda la industria, las empresas están empezando a alarmarse por el precio de la inteligencia artificial. Uber agotó todo su presupuesto de codificación de IA para 2026 en abril. Microsoft revocó las licencias de Claude Code para sus desarrolladores meses después de habilitarlas. Un empleado de Priceline informó que una renovación rutinaria del contrato de Cursor resultó ser 4-5 veces más cara. Aunque los precios por token han caído, el impulso por una mayor adopción de IA y agentes cada vez más autónomos ha disparado el consumo de tokens. Las empresas que se atiborraron de suscripciones ilimitadas a principios de 2025 ahora se apresuran a entender dónde está yendo su dinero, reducir el gasto y determinar si pueden rescatar algo de ROI de los escombros de sus presupuestos.

Mientras tanto, está surgiendo un mercado para abordar este problema. Startups, proveedores establecidos y un nuevo organismo de estándares compiten para dar a las empresas las herramientas y el lenguaje para rastrear su gasto.

Símbolo del dólar fracturado sobre circuitos, representando costos de IA
La gestión de costos de tokens se ha convertido en una prioridad urgente para las empresas que adoptan IA.

El Cambio de Conversación: De Capacidad a Control

“Hace seis meses, tenía una conversación con un cliente y todo giraba en torno a ‘¿Qué puede hacer? ¿Es lo suficientemente bueno?’”, dijo Alexander Embricos, jefe de empresa de OpenAI, en un evento esta semana. “Ahora las conversaciones nunca son sobre eso. Ahora las conversaciones son sobre ‘Oye, estamos gastando mucho. ¿Qué visibilidad tienes? ¿Qué auditabilidad tienes? ¿Qué controles de tokens tienes? ¿Cuál es la eficiencia de tus modelos?’”

Es en este contexto que la Linux Foundation reveló esta semana los planes para la Tokenomics Foundation, un nuevo organismo de estándares que busca inculcar la misma disciplina de costos alrededor de los tokens de IA que FinOps hizo para el gasto en la nube.

“En abril y mayo, comencé a escuchar de empresas: ‘Dios mío, estamos tres veces por encima de todo nuestro presupuesto de tokens para 2026 y solo es abril’”, dijo J.R. Storment, director ejecutivo de la FinOps Foundation, un proyecto bajo la Linux Foundation. “Comenzamos a escuchar crisis existenciales, y toda la conversación pasó de tokenmaxxing y ‘ir rápido’ a ‘necesitamos barreras de protección, ¿cómo controlamos esto?’”

Los Modelos Más Potentes Disparan el Consumo

Los nuevos modelos lanzados en noviembre como Anthropic’s Claude Opus 4.5, OpenAI’s GPT-5.1 y Google’s Gemini 3 Pro trajeron mejoras significativas a las herramientas agentivas, que han multiplicado el consumo. Es así como una empresa supuestamente se encontró con una factura de Claude de 500 millones de dólares después de olvidarse de establecer límites de uso para los empleados.

Comparación entre Gemini 3 Pro y Claude Opus 4.6
La competencia entre modelos como Gemini 3 Pro y Claude Opus 4.6 impulsa capacidades pero también costos.

“Es como la epidemia de crack”, dijo Chris Reed, director senior de finanzas de TI en Priceline, señalando que la empresa había comenzado a colocar límites de tokens en ciertos grupos. “Te dejan probarlo para engancharte, y ahora estás en deuda con ello”.

Vitaly Gordon, CEO de la plataforma de operaciones de ingeniería Faros AI, dijo que recientemente habló con un CTO que le comentó: “Uno de mis ingenieros gastó $40,000 en tokens el mes pasado, y realmente no sé si debería detenerlo o decirle a todos los demás que sean como él”.

Datos Revelan Productividad Costosa

Una encuesta de Faros en marzo encontró que entre 20,000 desarrolladores, la producción aumentaba, pero también los errores y las reescrituras. Jellyfish, una plataforma de gestión de ingeniería, encontró que los ingenieros que más usaban tokens eran aproximadamente dos veces más productivos que aquellos que usaban menos IA, pero gastaban 10 veces más tokens para llegar allí.

Nicholas Arcolano, jefe de investigación de Jellyfish, dijo que el gasto en IA está explotando en gran parte debido a las funciones agentivas, con un consumo por desarrollador que aumenta alrededor de 18.6 veces en nueve meses. “Si el gasto extremo vale la pena depende del valor comercial final del código enviado (ej. ingresos), que la mayoría de las empresas aún no pueden medir”, agregó.

El Reto de Medir: De Datos de Nube a Datos de Tokens

“Rastrear costos en la nube es un problema de datos de cientos de millones de filas al mes”, dijo Storment. “Rastrear costos de tokens es un problema de datos de billones de filas al mes. No puedes simplemente meterlo en una hoja de cálculo o herramienta básica. Tienes que repensar fundamentalmente tus herramientas, especificaciones y sistemas contables para hacerlo”.

En Priceline, Reed ya ve discrepancias entre el uso reportado por un proveedor y los datos internos. “Comencé mi carrera en la gestión de gastos de telecomunicaciones, y estoy viendo todos los mismos paralelismos, desde telecomunicaciones hasta la nube y la IA”, dijo. “Cada vez que introduces algo nuevo, está maduro para errores de facturación y oportunidades de optimización”.

Surge un Mercado de Soluciones

Un mercado está comenzando a formarse alrededor de este problema. Hay empresas puras como Pay-i que rastrea, mide y optimiza los costos y el rendimiento de las inversiones en IA generativa. Paid permite a los desarrolladores rastrear costos, medir el uso y facturar a los usuarios según el valor real en lugar de tarifas de suscripción. Luego están empresas como Jellyfish, Waydev y Faros AI, que proporcionan monitoreo de agentes de IA para demostrar el ROI de las herramientas de desarrollador. Storment dice que la mayoría de los 180 proveedores dentro de la FinOps Foundation se están inclinando hacia este espacio.

Las empresas con distribución existente también están agregando nuevas funciones. Ramp se ha movido recientemente hacia la gestión del gasto en IA; Datadog y New Relic han añadido servicios como gestión de costos en la nube, observabilidad a nivel de token y monitoreo de GPU. En la conferencia FinOps X de la próxima semana, se espera que AWS introduzca nuevas funciones de gestión financiera orientadas al gasto empresarial en IA.

Gráfico de tendencias de IA mostrando análisis de costos y rendimiento
El análisis de tendencias muestra un aumento en el gasto en IA a medida que las empresas buscan claridad.

Tiffany Luck, socia de NEA, piensa que la eficiencia de tokens y la observabilidad probablemente se agregarán en la “capa de harness o app”. Señaló a Factory, una startup que fabrica agentes de IA para empresas, que esta semana lanzó un enrutador de modelos que elige automáticamente el modelo correcto para cada tarea.

Gordon espera que los laboratorios de frontera y otros proveedores de modelos adopten la optimización estilo OpenRouter para dirigir las consultas a los modelos más baratos, una tendencia que ya se muestra en las facturas empresariales de Claude. “El informe financiero de cuánto gastas en Anthropic, incluso si llamas al modelo Opus, parte del gasto será en Sonnet o Haiku, porque son lo suficientemente inteligentes para hacerlo”, dijo. “Creo que esto será cada vez más común”.

La Tokenomics Foundation: Hacia Estándares Comunes

Pero todas estas herramientas se están construyendo sin un lenguaje común o definiciones compartidas sobre cuánto cuesta un token, qué produce y cómo comparar el gasto entre proveedores. Ahí es donde la Tokenomics Foundation espera ser útil. La Fundación está construyendo una definición canónica y un marco para la “tokenomics”; estándares abiertos, especificaciones y métricas para el uso y la facturación de tokens de IA; así como nuevas métricas para la economía de la IA, como costo por inteligencia o tokens por vatio. También planea definir métricas de efectividad de fábrica de tokens y eficiencia de consumo. El grupo planea un lanzamiento formal en julio y está a punto de anunciar más miembros en la conferencia FinOps X la próxima semana.

“La economía de tokens es fundamentalmente más abstracta y opaca que cualquier cosa que hayamos gestionado a esta escala antes”, dijo Nishant Gupta, director de disponibilidad de Salesforce, en un comunicado. “Requiere un músculo operativo diferente al que la industria construyó para la nube”.

Perspectivas Futuras: Gasto en Auge y Necesidad de Control

Goldman Sachs proyecta que el uso global de tokens se multiplicará por 24 veces para 2030. Las empresas ya están por encima del presupuesto y necesitan soluciones ahora, pero el primer entregable de la fundación aún está a meses de distancia. “Tal vez creamos una máquina de vapor, pero todavía no hemos descubierto la línea de ensamblaje”, dijo Gordon.

Según Arcolano, la jugada inteligente es una adopción amplia y moderada. “El mejor ROI proviene de mover la amplia clase media de uso bajo a moderado, no de empujar a los usuarios intensivos más alto”, dijo.

Este reportaje fue elaborado con información de múltiples fuentes de la industria.

Comparte este artículo

Otras notas de tu interés:

Economia

Elección de Recertificación del Sindicato de Maestros de Miami-Dade: Una Nueva Batalla por la Supervivencia

Noticia Local

Impresión 3D y nanobots: el laboratorio de la Universidad de Miami que está redefiniendo la medicina

Economia

Florida gasta $1,000 millones en centros de detención de inmigrantes de DeSantis

Economia

Alcaldesa de Miami-Dade rechaza acuerdo de $400 millones por patio de combustible de PortMiami

Politica Internacional

Acuerdo Bipartidista sobre IA: Un Análisis de la Realidad

Economia

AirTrunk Invierte $30 Mil Millones en Centros de Datos de IA en India: Un Impulso Histórico para la Infraestructura Digital

Economia

Levine Cava rechaza acuerdo de $400 millones por estación de combustible de PortMiami

Politica Internacional

Ley de Espionaje: Extensión, Riesgos y el Rechazo del Senado al Debate

Politica

Putin Refuerza las Defensas Aéreas de Rusia como Respuesta a los Ataques con Drones Ucranianos

Negocios

Mira Murati Rompe el Silencio y Revela los Detalles de Thinking Machines: Modelos de Interacción con IA