Google Gemini Pro 3.1 lidera los benchmarks: un salto revolucionario en IA

Google presenta su modelo de IA más avanzado hasta la fecha

Este jueves, Google lanzó la versión más reciente de Gemini Pro, su potente modelo de lenguaje grande (LLM). El nuevo Gemini 3.1 está disponible actualmente como vista previa y se lanzará de forma general próximamente, según informó la compañía.

El nuevo modelo de Google podría ser uno de los LLM más potentes hasta ahora. Los observadores han notado que Gemini 3.1 Pro parece ser un gran paso adelante respecto a su predecesor, Gemini 3, que, tras su lanzamiento en noviembre, ya era considerado una herramienta de IA altamente capaz.

Resultados de benchmarks independientes

Google también compartió estadísticas de benchmarks independientes, como uno llamado Humanity’s Last Exam, que mostraron un rendimiento significativamente mejor que su versión anterior.

Gráfico que compara el rendimiento de modelos de IA frente a estándares humanos en diversas capacidades a lo largo del tiempo
Evolución del rendimiento técnico de los modelos de IA frente a los estándares humanos. Fuente: Stanford University AI Index Report 2024.

Reconocimiento en la industria

Gemini 3.1 Pro fue también elogiado por Brendan Foody, CEO de la startup de IA Mercor, cuyo sistema de benchmarking, APEX, está diseñado para medir qué tan bien los nuevos modelos de IA realizan tareas profesionales reales.

“Gemini 3.1 Pro está ahora en la cima del tablero de líderes APEX-Agents”, dijo Foody en una publicación en redes sociales, añadiendo que los impresionantes resultados del modelo muestran “qué tan rápido están mejorando los agentes en el trabajo de conocimiento real”.

Tabla que detalla diferentes modelos de lenguaje de varias instituciones, incluyendo parámetros y fechas de lanzamiento
Tabla comparativa de modelos de lenguaje abiertos en el benchmark HELM.

El panorama competitivo se intensifica

El lanzamiento llega en un momento en que las guerras de modelos de IA se están calentando, y las compañías tecnológicas continúan lanzando LLM cada vez más poderosos diseñados para trabajo agéntico y razonamiento de múltiples pasos. Otros grandes nombres, como OpenAI y Anthropic, también han lanzado recientemente nuevos modelos.

Collage de gráficos dispersos que representan análisis estadísticos de rendimiento de modelos de IA
Diversos análisis de benchmarks de IA del hub de Epoch AI.

¿Qué significa esto para el futuro de la IA?

Los avances rápidos en el rendimiento de los benchmarks, como los mostrados por Gemini Pro 3.1, indican una carrera acelerada hacia modelos de inteligencia artificial más capaces y versátiles, capaces de realizar tareas complejas de conocimiento que antes eran dominio exclusivo humano.

Comparte este artículo

Otras notas de tu interés:

Politica

Aron D’Souza lanza Objection: IA y exagentes para auditar el periodismo y combatir la desconfianza

Negocios

OpenAI Potencia su SDK de Agentes para Empresas con Nuevas Capacidades de Seguridad

Negocios

Waymo Conquista las Carreteras de Miami: Viajes Autónomos en Autopista Ya Son una Realidad

Negocios

Google desafía a OpenAI y Anthropic con el lanzamiento de su app nativa Gemini para Mac

Negocios

Objection: La startup respaldada por Peter Thiel que usa IA para calificar y ‘juzgar’ la verdad en el periodismo

Negocios

Gizmo AI: La app de aprendizaje gamificado supera los 13 millones de usuarios y cierra una ronda de inversión de $22 millones

Negocios

Gizmo Alcanza 13 Millones de Usuarios y Cierra una Ronda de Inversión de $22 Millones

Economia

IA y Contratación Laboral: LinkedIn Desmiente Impacto Inmediato pero Advierte Cambio Profundo

Economia

Hightouch Alcanza $100 Millones en Ingresos Anuales con Herramientas de Marketing con IA

Negocios

Emergent lanza Wingman: el agente de IA autónomo que opera en WhatsApp y Telegram