La nueva generación de OpenSearch Serverless de AWS está diseñada para flujos de trabajo de agentes de inteligencia artificial
La infraestructura de la nube, tradicionalmente diseñada para humanos que buscan, hacen clic, se desplazan y transmiten de forma constante y predecible, ahora debe adaptarse a un nuevo protagonista: los agentes de IA. Estos agentes se comportan de manera diferente: pueden desatar una oleada de actividad, lanzando múltiples subagentes que consultan cientos de bases de datos, buscan documentos y llaman a API en cuestión de segundos, para luego desaparecer tan rápido como llegaron.
Bajo esa premisa, Amazon Web Services (AWS) ha rediseñado una pieza central de su infraestructura en la nube. El jueves pasado, AWS lanzó su nueva generación de OpenSearch Serverless, una base de datos de búsqueda y vectores totalmente gestionada —esencialmente un sistema para almacenar y recuperar información a escala— diseñada específicamente para cargas de trabajo de agentes. Según AWS, el nuevo sistema puede escalar instantáneamente cuando los agentes activan tareas y reducirse a cero cuando están inactivos.
El crecimiento del tráfico no humano
Si bien los agentes de IA aún representan una porción relativamente pequeña de la actividad en internet, el tráfico generado por máquinas ya es significativo y está destinado a crecer. Según Cloudflare, los bots representaron el 31% del tráfico HTTP total durante los últimos seis meses. Los rastreadores de IA, motores de búsqueda y asistentes constituyeron aproximadamente una cuarta parte de todas las solicitudes de bots en ese período.
“El tráfico no humano superará al tráfico humano en algún momento del primer semestre de 2027”, afirmó Lai Yi Ohlsen, gerente senior de producto de Cloudflare.
En la conferencia de desarrolladores Google I/O de la semana pasada, la compañía anunció que los usuarios podrán delegar tareas a sistemas de IA, como investigar compras, reservar viajes, navegar por la web e interactuar con aplicaciones. Pero la tendencia no se limita a los agentes de IA orientados al consumidor. Las empresas están implementando cada vez más agentes internamente y para sus clientes, creando nuevos tipos de tráfico generado por máquinas entre bastidores.
OpenSearch Serverless: la solución de AWS
“El momento es claro. Los agentes están pasando de la experimentación a la producción, y crean patrones de tráfico para los que la infraestructura anterior simplemente no fue diseñada”, explicó Tia White, gerente general de Amazon OpenSearch Service. “Spikean sin previo aviso, se vuelven inactivos sin notificar, y las empresas necesitan una búsqueda que se mantenga al día sin pagar por cómputo inactivo o vacío”.
El cambio técnico clave de esta nueva generación es que desacopla el cómputo del almacenamiento, permitiendo que el cómputo escale en segundos para absorber los picos de actividad de los agentes y se reduzca a cero, de modo que los clientes paguen $0 cuando los agentes están inactivos.
“Anteriormente, incluso en nuestra versión Serverless anterior, tenías que tener al menos una instancia operativa porque el almacenamiento y el cómputo estaban acoplados”, dijo White. “No podías simplemente activar automáticamente el cómputo a la velocidad que necesitabas, por lo que siempre tenías cómputo inactivo reservado para tu carga de trabajo, lo estuvieras usando o no”.
Piense en ello como pagar siempre por un espacio de estacionamiento, incluso cuando no lo usa. Con el OpenSearch Serverless mejorado de AWS, es más como pagar por un espacio de estacionamiento medido.
Integraciones nativas con plataformas de desarrollo
En su lanzamiento, OpenSearch Serverless se integrará de forma nativa con plataformas de desarrollo de IA como Vercel y Kiro, lo que permitirá a los desarrolladores implementar backends de búsqueda y vectores listos para producción para agentes sin tener que gestionar la infraestructura.
La transformación en toda la industria cloud
Este cambio se está produciendo en todo el sector de la nube. Empresas como Databricks y Snowflake se están reposicionando como sistemas de memoria y recuperación de IA para datos empresariales. Microsoft ha lanzado actualizaciones de Azure diseñadas para manejar picos de agentes de IA y compartir memoria entre agentes. Cloudflare, de manera similar a Amazon, presentó el mes pasado infraestructura destinada a proporcionar entornos persistentes y escalabilidad instantánea a los agentes.

Cuanto más desplieguen las empresas agentes de IA, mayor será la presión para rediseñar la infraestructura en torno a las cargas de trabajo generadas por máquinas, lo que a su vez podría hacer que los agentes sean más baratos y fáciles de implementar a escalas mayores.