Mistral desafía a los gigantes tecnológicos con su nuevo modelo de IA para audio
La startup francesa de inteligencia artificial Mistral ha entrado en la carrera del procesamiento de audio con el lanzamiento de Voxtral, su primera familia de modelos de código abierto diseñada específicamente para aplicaciones de voz. Este innovador sistema promete ofrecer una alternativa asequible y de alto rendimiento frente a soluciones corporativas cerradas.
Características revolucionarias de Voxtral
- Capacidad: Transcripción de hasta 30 minutos de audio y comprensión de contenido de hasta 40 minutos
- Multilingüe: Soporte para español, inglés, francés, portugués, hindi, alemán, holandés e italiano
- Funcionalidades: Generación de resúmenes, respuesta a preguntas sobre el contenido de audio y ejecución de comandos de voz en tiempo real
Modelos disponibles y precios competitivos
Mistral ofrece dos variantes principales adaptadas a diferentes necesidades:
- Voxtral Small (24B parámetros): Para implementaciones a escala industrial, compite directamente con ElevenLabs Scribe, GPT-4o-mini y Gemini 2.5 Flash
- Voxtral Mini (3B parámetros): Optimizado para despliegues locales y en dispositivos de borde, con una versión económica para transcripción (Voxtral Mini Transcribe) que supera a OpenAI Whisper por menos de la mitad del precio
La integración de la API comienza desde $0.001 por minuto, con pruebas gratuitas disponibles en Hugging Face y el chatbot Le Chat de Mistral.

Impacto en el ecosistema de IA
Este lanzamiento llega un mes después de Magistral, la familia de modelos de razonamiento de Mistral. La compañía, conocida por su defensa del código abierto, está en conversaciones para recaudar hasta $1.000 millones de inversionistas como el fondo MGX de Abu Dhabi, consolidando su posición como una de las principales firmas de IA en Europa.