Probably AI asegura $9 millones para revolucionar la precisión en corrección de errores de IA

Nueva financiación impulsa la lucha contra las alucinaciones en modelos de lenguaje

Los modelos de lenguaje de gran escala (LLM) han avanzado enormemente, pero las alucinaciones y los errores fácticos siguen siendo un desafío persistente. La startup Probably acaba de cerrar una ronda de financiación inicial de $9 millones liderada por Andreessen Horowitz para desarrollar un enfoque más riguroso que evite que estos errores lleguen al usuario final.

El objetivo: alcanzar un 99.99% de precisión

Como explica el fundador Peter Elias, la meta de Probably es lograr una precisión del 99.99%, similar a la de sistemas deterministas, pero mucho más difícil de conseguir en el ámbito de la inteligencia artificial. Para ello, la compañía ha tenido que replantear muchas de las suposiciones básicas de la ingeniería de IA.

Producto inicial: una herramienta de ciencia de datos con auditoría

El primer producto de Probably es una herramienta de ciencia de datos diseñada para ofrecer respuestas rápidas a partir de conjuntos de datos complejos. Cada resultado incluye una cita verificable y un rastro de auditoría sobre cómo se generó, una práctica cada vez más común entre las herramientas de IA.

Pero lo que realmente diferencia a Probably es su sistema de arnés elaborado, que el propio Elias describe como un “traje mecánico de ciencia de datos”. Las respuestas iniciales del LLM se verifican mediante un sistema validador determinista que rechaza cualquier resultado que no coincida con el conjunto de datos original.

“Lo que aprendimos construyendo esto fue que cuanto mejor sea tu ingeniería de arnés, más débil puede ser el modelo. Si puedes refinar el contexto lo suficiente, el modelo no tiene que trabajar tan duro para hacer lo correcto. Básicamente, es un ejercicio de reducción de ambigüedad.”

— Peter Elias, fundador de Probably

Modelos más pequeños, costos reducidos

Este enfoque permite que la herramienta de Probably funcione con modelos de IA significativamente más pequeños. Según Elias, la versión actual se ejecuta en un modelo “cuatro clases más débil que los modelos frontera”, lo que significa que puede operar en hardware local (como un ordenador de escritorio) en lugar de un centro de datos, reduciendo drásticamente los costos de tokens asociados al uso de IA.

Esta eficiencia llega en un momento en que los costos de tokens están aumentando y muchos clientes reevalúan sus presupuestos de IA. La tecnología de Probably no se limita solo a la ciencia de datos; el mismo motor puede extenderse a casos de uso como contabilidad, servicios médicos y, en definitiva, cualquier aplicación sensible a la precisión.

Visualización abstracta tecnológica en azul y verde que representa el flujo de datos y la inteligencia artificial
La innovación de Probably se apoya en sistemas de verificación que permiten usar modelos más ligeros sin sacrificar precisión.

Una estrategia que desafía a los grandes laboratorios

Elias señala que los grandes laboratorios de IA no han intentado este enfoque porque “están incentivados a no hacerlo, ya que ganan dinero cuantas más veces tengas que corregir el modelo”. Probably, en cambio, apuesta por la corrección desde el origen, evitando que los errores lleguen al usuario final y reduciendo la necesidad de ciclos de corrección posteriores.

Con esta financiación, la startup planea escalar su tecnología y expandir su alcance a más sectores donde la exactitud es crítica, posicionándose como un actor clave en la búsqueda de una IA más confiable y eficiente.

Comparte este artículo

Otras notas de tu interés:

Negocios

Google y Apple bajo la lupa de Raskin ICE: Investigación por presuntas violaciones migratorias

Economia

Republican House Pressure Mounts on Data Centers in the USA

Negocios

Consumidores en EE.UU. desconfían de la inteligencia artificial en marketing, según nuevo estudio

Negocios

Plaud alcanza un hito histórico: su negocio de software supera los $100 millones en ingresos anuales

Economia

DOJ defiende a xAI en el uso de turbinas de gas no autorizadas en Memphis

Economia

Revuelta en Estados Conservadores: La Lucha Contra las Aseguradoras en EE.UU.

Economia

Robinhood despide a 290 empleados sin mencionar la inteligencia artificial: ¿nueva tendencia?

Economia

Investigación sobre seguridad de Brightline en Florida gana premio y desbloquea $42 millones

Negocios

Mansiones de lujo en Fisher Island: la nueva frontera de la exclusividad en Miami

Bienestar y Salud Mental

Cadena de mando en fraude de diplomas de enfermería: Directora de escuelas se declara culpable en Florida