Google Gemini Pro 3.1 lidera los benchmarks: un salto revolucionario en IA

Google presenta su modelo de IA más avanzado hasta la fecha

Este jueves, Google lanzó la versión más reciente de Gemini Pro, su potente modelo de lenguaje grande (LLM). El nuevo Gemini 3.1 está disponible actualmente como vista previa y se lanzará de forma general próximamente, según informó la compañía.

El nuevo modelo de Google podría ser uno de los LLM más potentes hasta ahora. Los observadores han notado que Gemini 3.1 Pro parece ser un gran paso adelante respecto a su predecesor, Gemini 3, que, tras su lanzamiento en noviembre, ya era considerado una herramienta de IA altamente capaz.

Resultados de benchmarks independientes

Google también compartió estadísticas de benchmarks independientes, como uno llamado Humanity’s Last Exam, que mostraron un rendimiento significativamente mejor que su versión anterior.

Gráfico que compara el rendimiento de modelos de IA frente a estándares humanos en diversas capacidades a lo largo del tiempo
Evolución del rendimiento técnico de los modelos de IA frente a los estándares humanos. Fuente: Stanford University AI Index Report 2024.

Reconocimiento en la industria

Gemini 3.1 Pro fue también elogiado por Brendan Foody, CEO de la startup de IA Mercor, cuyo sistema de benchmarking, APEX, está diseñado para medir qué tan bien los nuevos modelos de IA realizan tareas profesionales reales.

“Gemini 3.1 Pro está ahora en la cima del tablero de líderes APEX-Agents”, dijo Foody en una publicación en redes sociales, añadiendo que los impresionantes resultados del modelo muestran “qué tan rápido están mejorando los agentes en el trabajo de conocimiento real”.

Tabla que detalla diferentes modelos de lenguaje de varias instituciones, incluyendo parámetros y fechas de lanzamiento
Tabla comparativa de modelos de lenguaje abiertos en el benchmark HELM.

El panorama competitivo se intensifica

El lanzamiento llega en un momento en que las guerras de modelos de IA se están calentando, y las compañías tecnológicas continúan lanzando LLM cada vez más poderosos diseñados para trabajo agéntico y razonamiento de múltiples pasos. Otros grandes nombres, como OpenAI y Anthropic, también han lanzado recientemente nuevos modelos.

Collage de gráficos dispersos que representan análisis estadísticos de rendimiento de modelos de IA
Diversos análisis de benchmarks de IA del hub de Epoch AI.

¿Qué significa esto para el futuro de la IA?

Los avances rápidos en el rendimiento de los benchmarks, como los mostrados por Gemini Pro 3.1, indican una carrera acelerada hacia modelos de inteligencia artificial más capaces y versátiles, capaces de realizar tareas complejas de conocimiento que antes eran dominio exclusivo humano.

Comparte este artículo

Otras notas de tu interés:

Economia

Publix Desmantelará su Tienda Emblemática en Doral para Construir un Supermercado Más Grande

Politica

La Estrategia de Ciberseguridad de Estados Unidos y la Respuesta de Trump a los Ciberataques

Politica Internacional

Irán aumenta la urgencia en acuerdo de drones entre el Pentágono y Ucrania

Politica

Casa Blanca investiga hackeo al sistema de vigilancia del FBI

Economia

Microsoft, Google y Amazon aseguran acceso a Claude de Anthropic para clientes no relacionados con la defensa

Economia

Desarrollador Inmobiliario Arrestado por Millonario Fraude a Inversores en Miami

Negocios

Fallo del Contrato de IA de Anthropic con el Pentágono: Consecuencias Clave para las Startups

Tecnologia

Anthropic Descubre 22 Vulnerabilidades, 14 Críticas, en Firefox Usando IA

Negocios

Claude experimenta un boom de usuarios tras su polémica negativa al Pentágono

Economia

City Detect recauda $13 millones en financiación Serie A para revolucionar la seguridad y limpieza urbana con IA