Los agentes de IA dan un salto en tareas profesionales, pero aún no sustituyen a los abogados

El progreso acelerado de la inteligencia artificial en el ámbito profesional

Hace apenas un mes, los benchmarks que medían las capacidades de los agentes de IA en tareas profesionales como el derecho y el análisis corporativo arrojaban resultados modestos, con todas las principales empresas de investigación obteniendo puntajes inferiores al 25%.

Sin embargo, la capacidad de la inteligencia artificial puede cambiar drásticamente en cuestión de semanas.

Diagrama que ilustra un error de puntero nulo, representando desafíos técnicos en programación

Desafíos técnicos como los punteros nulos simbolizan los obstáculos que la IA debe superar en su desarrollo.

Opus 4.6 de Anthropic sacude el panorama

El reciente lanzamiento del modelo Opus 4.6 de Anthropic ha revolucionado las clasificaciones. Este nuevo modelo logró un puntaje de 29.8% en pruebas de un solo intento y un promedio de 45% cuando se le dieron múltiples oportunidades para resolver los problemas.

El lanzamiento incluyó una serie de nuevas características agenticas, como los «enjambres de agentes» (agent swarms), que podrían haber contribuido a esta mejora en la resolución de problemas de múltiples pasos.

Representación visual de una cadena de caracteres terminada en nulo, concepto fundamental en programación

La precisión en el manejo de datos, como la terminación de cadenas, es crucial para el funcionamiento de los sistemas de IA.

Una mejora «insana» en pocos meses

Este puntaje representa un avance significativo respecto al estado anterior de la técnica. Brendan Foody, CEO de Mercor, se mostró particularmente impresionado, declarando:

«Saltar del 18.4% al 29.8% en unos meses es una locura (insane)».

¿Deben preocuparse los profesionales?

Aunque el 30% aún está muy lejos del 100%, esto no significa que los abogados vayan a ser reemplazados por máquinas la próxima semana. No obstante, deberían estar mucho menos confiados de lo que estaban el mes pasado.

El rápido progreso en los modelos fundacionales muestra que la evolución de la IA no se está desacelerando, marcando un antes y un después en la evaluación de sus capacidades para tareas complejas y especializadas.

Figura estilizada que representa el concepto de 'nulo' o vacío

La representación abstracta de ‘nulo’ invita a reflexionar sobre los límites actuales y el potencial futuro de la IA.

Comparte este artículo

Otras notas de tu interés:

Economia

Centros de datos orbitales: ejecutivos tecnológicos cuestionan la viabilidad de la visión de Musk

Politica Internacional

Administración Trump limita el lanzamiento del último modelo de OpenAI

Politica Internacional

Corea del Norte reafirma su poderío militar con nuevas pruebas de armas

Para Inmigrantes

Corte Suprema allana el fin del TPS: más de 350,000 haitianos y sirios en riesgo

Noticia Local

Miami debate su acuerdo con ICE: tres comisionados dispuestos a salir del programa 287(g)

Politica

Orlando Jorge ’24: El Logo que Define el Camino hacia las Elecciones

Economia

Terremoto en Venezuela: Más de 589 fallecidos, 2.980 heridos y miles de desaparecidos

Economia

Última oportunidad: Ahorra hasta $190 en el Founder Summit 2026 – Precio límite esta noche

Noticia Local

Oposición arrolladora en Miami contra el acuerdo ICE 287(g): Comisionados dispuestos a salir

Noticia Local

Terremoto en Venezuela en 2023: 589 muertos y 2.980 heridos; llega ayuda internacional