Los agentes de IA dan un salto en tareas profesionales, pero aún no sustituyen a los abogados

El progreso acelerado de la inteligencia artificial en el ámbito profesional

Hace apenas un mes, los benchmarks que medían las capacidades de los agentes de IA en tareas profesionales como el derecho y el análisis corporativo arrojaban resultados modestos, con todas las principales empresas de investigación obteniendo puntajes inferiores al 25%.

Sin embargo, la capacidad de la inteligencia artificial puede cambiar drásticamente en cuestión de semanas.

Diagrama que ilustra un error de puntero nulo, representando desafíos técnicos en programación

Desafíos técnicos como los punteros nulos simbolizan los obstáculos que la IA debe superar en su desarrollo.

Opus 4.6 de Anthropic sacude el panorama

El reciente lanzamiento del modelo Opus 4.6 de Anthropic ha revolucionado las clasificaciones. Este nuevo modelo logró un puntaje de 29.8% en pruebas de un solo intento y un promedio de 45% cuando se le dieron múltiples oportunidades para resolver los problemas.

El lanzamiento incluyó una serie de nuevas características agenticas, como los «enjambres de agentes» (agent swarms), que podrían haber contribuido a esta mejora en la resolución de problemas de múltiples pasos.

Representación visual de una cadena de caracteres terminada en nulo, concepto fundamental en programación

La precisión en el manejo de datos, como la terminación de cadenas, es crucial para el funcionamiento de los sistemas de IA.

Una mejora «insana» en pocos meses

Este puntaje representa un avance significativo respecto al estado anterior de la técnica. Brendan Foody, CEO de Mercor, se mostró particularmente impresionado, declarando:

«Saltar del 18.4% al 29.8% en unos meses es una locura (insane)».

¿Deben preocuparse los profesionales?

Aunque el 30% aún está muy lejos del 100%, esto no significa que los abogados vayan a ser reemplazados por máquinas la próxima semana. No obstante, deberían estar mucho menos confiados de lo que estaban el mes pasado.

El rápido progreso en los modelos fundacionales muestra que la evolución de la IA no se está desacelerando, marcando un antes y un después en la evaluación de sus capacidades para tareas complejas y especializadas.

Figura estilizada que representa el concepto de 'nulo' o vacío

La representación abstracta de ‘nulo’ invita a reflexionar sobre los límites actuales y el potencial futuro de la IA.

Comparte este artículo

Otras notas de tu interés:

Sociedad y Cultura

Campbell Brown y Forum AI: La lucha por la verdad en la era de la inteligencia artificial

Economia

Clio Alcanza $500M en ARR: La IA Impulsa el Crecimiento del Sector Legal Tech

Economia

Exdirector de hacking de L3Harris pagará $10 millones por vender herramientas a un broker ruso

Economia

Amazon Lanza ‘Amazon Now’: Entregas en 30 Minutos en Estados Unidos

Tecnologia

Google lanza ‘Create My Widget’: personaliza tu Android con inteligencia artificial

Tecnologia

Google I/O: Nuevas funciones de IA Gemini transforman Android con widgets, navegación y asistencia inteligente

Negocios

Anthropic lanza nuevas herramientas de IA para el sector legal en medio de una intensa competencia

Politica

Ex donante demócrata y candidato arrestado en Los Ángeles

Negocios

Google lanza Rambler: la función de dictado con IA para Gboard que desafía a las startups

Tecnologia

Android Show de Google: Nuevas funciones, Googlebook y Gemini llegan con grandes actualizaciones