Los agentes de IA dan un salto en tareas profesionales, pero aún no sustituyen a los abogados

El progreso acelerado de la inteligencia artificial en el ámbito profesional

Hace apenas un mes, los benchmarks que medían las capacidades de los agentes de IA en tareas profesionales como el derecho y el análisis corporativo arrojaban resultados modestos, con todas las principales empresas de investigación obteniendo puntajes inferiores al 25%.

Sin embargo, la capacidad de la inteligencia artificial puede cambiar drásticamente en cuestión de semanas.

Diagrama que ilustra un error de puntero nulo, representando desafíos técnicos en programación

Desafíos técnicos como los punteros nulos simbolizan los obstáculos que la IA debe superar en su desarrollo.

Opus 4.6 de Anthropic sacude el panorama

El reciente lanzamiento del modelo Opus 4.6 de Anthropic ha revolucionado las clasificaciones. Este nuevo modelo logró un puntaje de 29.8% en pruebas de un solo intento y un promedio de 45% cuando se le dieron múltiples oportunidades para resolver los problemas.

El lanzamiento incluyó una serie de nuevas características agenticas, como los «enjambres de agentes» (agent swarms), que podrían haber contribuido a esta mejora en la resolución de problemas de múltiples pasos.

Representación visual de una cadena de caracteres terminada en nulo, concepto fundamental en programación

La precisión en el manejo de datos, como la terminación de cadenas, es crucial para el funcionamiento de los sistemas de IA.

Una mejora «insana» en pocos meses

Este puntaje representa un avance significativo respecto al estado anterior de la técnica. Brendan Foody, CEO de Mercor, se mostró particularmente impresionado, declarando:

«Saltar del 18.4% al 29.8% en unos meses es una locura (insane)».

¿Deben preocuparse los profesionales?

Aunque el 30% aún está muy lejos del 100%, esto no significa que los abogados vayan a ser reemplazados por máquinas la próxima semana. No obstante, deberían estar mucho menos confiados de lo que estaban el mes pasado.

El rápido progreso en los modelos fundacionales muestra que la evolución de la IA no se está desacelerando, marcando un antes y un después en la evaluación de sus capacidades para tareas complejas y especializadas.

Figura estilizada que representa el concepto de 'nulo' o vacío

La representación abstracta de ‘nulo’ invita a reflexionar sobre los límites actuales y el potencial futuro de la IA.

Comparte este artículo

Otras notas de tu interés:

Noticia Local

Iglesias de Florida alzan la voz contra la pena de muerte en víspera de ejecución

Politica

Trump alertó a policía sobre Epstein en 2006, revela entrevista inédita del FBI

Economia

Gobierno de EE.UU. Negocia Acuerdos para Centros de Datos en Medio de Crisis Energética

Arte y Cultura

Bad Bunny hace historia en el Super Bowl con un show cargado de cultura e identidad puertorriqueña

Economia

Anthropic se Enfrenta a una Empresa India en una Disputa por el Nombre

Noticia Local

Iglesias de Florida se movilizan contra la pena de muerte en víspera de ejecución

Economia

Crisis de Combustible en Cuba: Aerolíneas Internacionales Afectadas y Turismo en Riesgo

Economia

Marcha por los Multimillonarios: Protesta Contra el Impuesto a la Riqueza en California

Arte y Cultura

Bad Bunny Escribe Historia: Un Halftime Show del Super Bowl Cargado de Símbolos Culturales y Protesta

Economia

OpenAI inicia pruebas de anuncios en ChatGPT para usuarios gratuitos en EE. UU.