Google Reduce Costos en IA con Nueva Tecnología de Caché Automático
Google ha implementado una función llamada «caché implícito» en su Gemini API, prometiendo reducir hasta un 75% los costos para desarrolladores que utilizan los modelos Gemini 2.5 Pro y 2.5 Flash. Esta actualización automatiza el reúso de contextos repetitivos, optimizando recursos computacionales.

¿Qué es el Caché Implícito?
A diferencia del sistema anterior (caché explícito), que requería identificar manualmente las consultas frecuentes, el caché implícito detecta automáticamente patrones repetidos en las solicitudes. Según Google, si una petición comparte un prefijo común con una anterior, se aplicará el ahorro de costos sin intervención del usuario.
- Tokens mínimos requeridos: 1,024 para Gemini 2.5 Flash y 2,048 para Gemini 2.5 Pro.
- Beneficio: Reducción de facturas en API para casos de uso con contextos recurrentes.

Contexto y Críticas Previas
El caché explícito en Gemini 2.5 Pro generó quejas por costos inesperados, lo que llevó a Google a disculparse y mejorar su sistema. Ahora, la compañía enfatiza que el nuevo método es «dinámico y transparente», aunque aún recomienda:
«Colocar el contexto repetitivo al inicio de las solicitudes y añadir variables al final para maximizar ahorros»
Recomendaciones Clave
- Priorizar estructura modular en el diseño de prompts.
- Validar ahorros con métricas de uso en tiempo real.
- Monitorizar actualizaciones en la documentación oficial.