DeepMind de Google refuerza su división de voz con un acquihire estratégico
En un movimiento que subraya la creciente importancia de la inteligencia artificial conversacional, Google DeepMind ha llegado a un acuerdo de licencia para incorporar al CEO Alan Cowen y aproximadamente a siete ingenieros de la startup de IA vocal Hume AI, según informes.
Detalles del acuerdo y el futuro de Hume AI
El acuerdo, cuyos términos financieros no han sido revelados, permitirá a DeepMind potenciar las capacidades de voz de su modelo Gemini. Mientras tanto, lo que queda de Hume AI continuará suministrando su tecnología patentada a otras empresas del sector.
La tendencia del ‘acquihire’ y el escrutinio regulatorio
Esta operación se enmarca en una tendencia creciente entre los gigantes de la IA: la adquisición de equipos de talento (acquihire) en lugar de comprar las startups completas, una práctica que puede eludir un examen regulatorio más exhaustivo.
- Ejemplos recientes: El año pasado, Google adquirió el CEO y varios investigadores de la startup de código IA Windsurf.
- OpenAI también ha integrado equipos de nuevas empresas como Covogo y Roi en los últimos meses.
La Comisión Federal de Comercio (FTC) de Estados Unidos ha anunciado recientemente que examinará más de cerca este tipo de transacciones.
La tecnología estrella de Hume AI: IA con inteligencia emocional
El valor clave de Hume AI reside en su capacidad para interpretar las emociones y el estado de ánimo de un usuario a través de su voz. En 2024, la startup lanzó su Empathetic Voice Interface (EVI), una IA conversacional con inteligencia emocional.
Según los datos, Hume AI ha recaudado cerca de $80 millones en financiación y espera generar $100 millones en ingresos durante el presente año.
La voz se consolida como el próximo campo de batalla en IA
Esta adquisición de talento refuerza la apuesta de Google por dominar la interacción por voz, una frontera que todos los principales actores están explorando agresivamente.
Las mejoras continuas de Gemini Live
Google ha estado mejorando constantemente su función Gemini Live, que permite conversaciones fluidas con el chatbot. El mes pasado, la compañía lanzó un nuevo modelo de audio nativo para la API Live, diseñado para manejar flujos de trabajo complejos con mayor eficacia.

La carrera se intensifica: OpenAI, Meta y otros
La competencia por la supremacía en audio es feroz:
- OpenAI prepara una revisión completa de sus modelos de audio para el lanzamiento de un dispositivo personal centrado en el audio, desarrollado con Jony Ive.
- Meta aceleró su impulso en audio IA adquiriendo la startup Play AI el año pasado. Sus gafas inteligentes Ray-Ban dependen cada vez más del control por voz.
La inversora Vanessa Larco ha señalado que «la voz es el único modo de entrada aceptable para los wearables», y que esta adquisición «solo acelerará la necesidad de aplicaciones de voz».
La demanda de capacidades de voz sigue en aumento. Empresas como ElevenLabs, especializada en generación de voces IA, ya reportan cientos de millones en ingresos recurrentes anuales.