Google Gemini Pro 3.1 lidera los benchmarks: un salto revolucionario en IA

Google presenta su modelo de IA más avanzado hasta la fecha

Este jueves, Google lanzó la versión más reciente de Gemini Pro, su potente modelo de lenguaje grande (LLM). El nuevo Gemini 3.1 está disponible actualmente como vista previa y se lanzará de forma general próximamente, según informó la compañía.

El nuevo modelo de Google podría ser uno de los LLM más potentes hasta ahora. Los observadores han notado que Gemini 3.1 Pro parece ser un gran paso adelante respecto a su predecesor, Gemini 3, que, tras su lanzamiento en noviembre, ya era considerado una herramienta de IA altamente capaz.

Resultados de benchmarks independientes

Google también compartió estadísticas de benchmarks independientes, como uno llamado Humanity’s Last Exam, que mostraron un rendimiento significativamente mejor que su versión anterior.

Gráfico que compara el rendimiento de modelos de IA frente a estándares humanos en diversas capacidades a lo largo del tiempo
Evolución del rendimiento técnico de los modelos de IA frente a los estándares humanos. Fuente: Stanford University AI Index Report 2024.

Reconocimiento en la industria

Gemini 3.1 Pro fue también elogiado por Brendan Foody, CEO de la startup de IA Mercor, cuyo sistema de benchmarking, APEX, está diseñado para medir qué tan bien los nuevos modelos de IA realizan tareas profesionales reales.

“Gemini 3.1 Pro está ahora en la cima del tablero de líderes APEX-Agents”, dijo Foody en una publicación en redes sociales, añadiendo que los impresionantes resultados del modelo muestran “qué tan rápido están mejorando los agentes en el trabajo de conocimiento real”.

Tabla que detalla diferentes modelos de lenguaje de varias instituciones, incluyendo parámetros y fechas de lanzamiento
Tabla comparativa de modelos de lenguaje abiertos en el benchmark HELM.

El panorama competitivo se intensifica

El lanzamiento llega en un momento en que las guerras de modelos de IA se están calentando, y las compañías tecnológicas continúan lanzando LLM cada vez más poderosos diseñados para trabajo agéntico y razonamiento de múltiples pasos. Otros grandes nombres, como OpenAI y Anthropic, también han lanzado recientemente nuevos modelos.

Collage de gráficos dispersos que representan análisis estadísticos de rendimiento de modelos de IA
Diversos análisis de benchmarks de IA del hub de Epoch AI.

¿Qué significa esto para el futuro de la IA?

Los avances rápidos en el rendimiento de los benchmarks, como los mostrados por Gemini Pro 3.1, indican una carrera acelerada hacia modelos de inteligencia artificial más capaces y versátiles, capaces de realizar tareas complejas de conocimiento que antes eran dominio exclusivo humano.

Comparte este artículo

Otras notas de tu interés:

Shopping y Compras

Pinterest lanza ‘Ask Pinterest’: la nueva app experimental de compras con inteligencia artificial

Economia

Ken Griffin Expande Su Imperio en Brickell: Nuevo Edificio de Apartamentos y Más Oficinas

Economia

Trump administración refuerza estrategias para agilizar el paso de petroleros por el Estrecho de Ormuz

Economia

White House y Anthropic: El Movimiento que Impacta la Política de Inteligencia Artificial en el Congreso

Economia

Plataforma de envío a Cuba vinculada a GAESA cesa operaciones tras sanciones de EE.UU.

Economia

Anthropic: La polémica con la administración Trump impulsa sus ventas empresariales

Economia

SpaceX supera a Amazon y Microsoft en valoración bursátil

Economia

Gavin Newsom genera controversia con su decisión sobre centros de datos en California

Economia

ChatGPT pierde el 50% de cuota de mercado: Gemini y Claude avanzan en 2026

Economia

Millonarios dividen lote de $67 millones en la exclusiva Manalapan, Florida