Nueva financiación impulsa la lucha contra las alucinaciones en modelos de lenguaje
Los modelos de lenguaje de gran escala (LLM) han avanzado enormemente, pero las alucinaciones y los errores fácticos siguen siendo un desafío persistente. La startup Probably acaba de cerrar una ronda de financiación inicial de $9 millones liderada por Andreessen Horowitz para desarrollar un enfoque más riguroso que evite que estos errores lleguen al usuario final.
El objetivo: alcanzar un 99.99% de precisión
Como explica el fundador Peter Elias, la meta de Probably es lograr una precisión del 99.99%, similar a la de sistemas deterministas, pero mucho más difícil de conseguir en el ámbito de la inteligencia artificial. Para ello, la compañía ha tenido que replantear muchas de las suposiciones básicas de la ingeniería de IA.
Producto inicial: una herramienta de ciencia de datos con auditoría
El primer producto de Probably es una herramienta de ciencia de datos diseñada para ofrecer respuestas rápidas a partir de conjuntos de datos complejos. Cada resultado incluye una cita verificable y un rastro de auditoría sobre cómo se generó, una práctica cada vez más común entre las herramientas de IA.
Pero lo que realmente diferencia a Probably es su sistema de arnés elaborado, que el propio Elias describe como un “traje mecánico de ciencia de datos”. Las respuestas iniciales del LLM se verifican mediante un sistema validador determinista que rechaza cualquier resultado que no coincida con el conjunto de datos original.
“Lo que aprendimos construyendo esto fue que cuanto mejor sea tu ingeniería de arnés, más débil puede ser el modelo. Si puedes refinar el contexto lo suficiente, el modelo no tiene que trabajar tan duro para hacer lo correcto. Básicamente, es un ejercicio de reducción de ambigüedad.”
Modelos más pequeños, costos reducidos
Este enfoque permite que la herramienta de Probably funcione con modelos de IA significativamente más pequeños. Según Elias, la versión actual se ejecuta en un modelo “cuatro clases más débil que los modelos frontera”, lo que significa que puede operar en hardware local (como un ordenador de escritorio) en lugar de un centro de datos, reduciendo drásticamente los costos de tokens asociados al uso de IA.
Esta eficiencia llega en un momento en que los costos de tokens están aumentando y muchos clientes reevalúan sus presupuestos de IA. La tecnología de Probably no se limita solo a la ciencia de datos; el mismo motor puede extenderse a casos de uso como contabilidad, servicios médicos y, en definitiva, cualquier aplicación sensible a la precisión.

Una estrategia que desafía a los grandes laboratorios
Elias señala que los grandes laboratorios de IA no han intentado este enfoque porque “están incentivados a no hacerlo, ya que ganan dinero cuantas más veces tengas que corregir el modelo”. Probably, en cambio, apuesta por la corrección desde el origen, evitando que los errores lleguen al usuario final y reduciendo la necesidad de ciclos de corrección posteriores.
Con esta financiación, la startup planea escalar su tecnología y expandir su alcance a más sectores donde la exactitud es crítica, posicionándose como un actor clave en la búsqueda de una IA más confiable y eficiente.