Google Gemini Pro 3.1 lidera los benchmarks: un salto revolucionario en IA

Google presenta su modelo de IA más avanzado hasta la fecha

Este jueves, Google lanzó la versión más reciente de Gemini Pro, su potente modelo de lenguaje grande (LLM). El nuevo Gemini 3.1 está disponible actualmente como vista previa y se lanzará de forma general próximamente, según informó la compañía.

El nuevo modelo de Google podría ser uno de los LLM más potentes hasta ahora. Los observadores han notado que Gemini 3.1 Pro parece ser un gran paso adelante respecto a su predecesor, Gemini 3, que, tras su lanzamiento en noviembre, ya era considerado una herramienta de IA altamente capaz.

Resultados de benchmarks independientes

Google también compartió estadísticas de benchmarks independientes, como uno llamado Humanity’s Last Exam, que mostraron un rendimiento significativamente mejor que su versión anterior.

Gráfico que compara el rendimiento de modelos de IA frente a estándares humanos en diversas capacidades a lo largo del tiempo
Evolución del rendimiento técnico de los modelos de IA frente a los estándares humanos. Fuente: Stanford University AI Index Report 2024.

Reconocimiento en la industria

Gemini 3.1 Pro fue también elogiado por Brendan Foody, CEO de la startup de IA Mercor, cuyo sistema de benchmarking, APEX, está diseñado para medir qué tan bien los nuevos modelos de IA realizan tareas profesionales reales.

“Gemini 3.1 Pro está ahora en la cima del tablero de líderes APEX-Agents”, dijo Foody en una publicación en redes sociales, añadiendo que los impresionantes resultados del modelo muestran “qué tan rápido están mejorando los agentes en el trabajo de conocimiento real”.

Tabla que detalla diferentes modelos de lenguaje de varias instituciones, incluyendo parámetros y fechas de lanzamiento
Tabla comparativa de modelos de lenguaje abiertos en el benchmark HELM.

El panorama competitivo se intensifica

El lanzamiento llega en un momento en que las guerras de modelos de IA se están calentando, y las compañías tecnológicas continúan lanzando LLM cada vez más poderosos diseñados para trabajo agéntico y razonamiento de múltiples pasos. Otros grandes nombres, como OpenAI y Anthropic, también han lanzado recientemente nuevos modelos.

Collage de gráficos dispersos que representan análisis estadísticos de rendimiento de modelos de IA
Diversos análisis de benchmarks de IA del hub de Epoch AI.

¿Qué significa esto para el futuro de la IA?

Los avances rápidos en el rendimiento de los benchmarks, como los mostrados por Gemini Pro 3.1, indican una carrera acelerada hacia modelos de inteligencia artificial más capaces y versátiles, capaces de realizar tareas complejas de conocimiento que antes eran dominio exclusivo humano.

Comparte este artículo

Otras notas de tu interés:

Negocios

Reload Lanza Epic: La Plataforma que Gestiona Agentes de IA como Empleados Digitales

Negocios

Reddit prueba búsqueda con IA para compras: productos recomendados por la comunidad al instante

Espectáculos y Entretenimiento

YouTube lleva su IA conversacional a los televisores inteligentes: así revoluciona la experiencia de streaming en 2024

Economia

CEO de Startups Desmitifican el Reemplazo de Empleos por IA: ¿Amenaza u Oportunidad?

Economia

Nvidia fortalece su ecosistema de IA en India con alianzas estratégicas para startups en etapa temprana

Economia

Fundación de la biblioteca de Trump adquiere terreno en el centro de Miami tras batalla legal

Economia

Cox Cuestiona a Trump Sobre la Regulación de Apuestas e Inteligencia Artificial

Economia

Shapiro pone a prueba la estrategia de centros de datos de los demócratas en EE. UU.

Politica

West Virginia demanda a Apple por presunto almacenamiento de imágenes de abuso infantil en iCloud

Negocios

Mirai Lidera la Revolución de la IA en Dispositivos con Motor de Inferencia Optimizado