El rápido avance de la IA en profesiones como el derecho
Hace apenas unos meses, los agentes de inteligencia artificial obtenían puntajes desalentadores en tareas profesionales complejas, como el análisis legal y corporativo. Sin embargo, un nuevo benchmark revela un salto significativo que podría cambiar el panorama.
Benchmark de Mercor: de menos del 25% a casi el 30%
El mes pasado, el benchmark de Mercor medía las capacidades de los agentes de IA en tareas profesionales, arrojando resultados por debajo del 25% para todos los laboratorios principales. Esto llevó a concluir que los abogados estaban a salvo de la sustitución por IA, al menos por el momento.
Pero las capacidades de la IA pueden cambiar mucho en unas semanas.
Anthropic’s Opus 4.6: un punto de inflexión
Esta semana, el lanzamiento de Anthropic’s Opus 4.6 sacudió los rankings, con el nuevo modelo logrando un puntaje de casi 30% en pruebas de un solo intento, y un promedio de 45% cuando se le dan múltiples oportunidades. El lanzamiento incluyó nuevas características agenticas, como «agent swarms» (enjambres de agentes), que pueden haber ayudado en este tipo de resolución de problemas de múltiples pasos.

Reacción del CEO de Mercor
«Saltar del 18.4% al 29.8% en unos meses es una locura», dijo Brendan Foody, CEO de Mercor, impresionado por el avance.
¿Deben preocuparse los abogados?
El 30% aún está lejos del 100%, por lo que no es que los abogados deban temer ser reemplazados por máquinas la próxima semana. Pero, como señala el informe, deberían estar mucho menos confiados que el mes pasado.

Este progreso muestra que la evolución de los modelos de base no se está desacelerando, y que la inteligencia artificial está ganando terreno en ámbitos profesionales que antes parecían inexpugnables.