DeepL Lanza Suite de Traducción Voz a Voz en Tiempo Real
La empresa de traducción DeepL, conocida por sus herramientas de texto, ha anunciado el lanzamiento de una suite de traducción voz a voz que cubre casos de uso como reuniones, conversaciones móviles y web, y conversaciones grupales para trabajadores de primera línea a través de aplicaciones personalizadas.
Productos y Acceso Temprano
DeepL está lanzando complementos para plataformas como Zoom y Microsoft Teams, donde los oyentes pueden escuchar la traducción en tiempo real mientras otros hablan en sus idiomas nativos o seguir el texto traducido en pantalla. Este programa se encuentra actualmente en acceso temprano, y la empresa está invitando a organizaciones a unirse a una lista de espera.

Conversaciones Grupales y Personalización
La suite también permite a los usuarios participar en conversaciones grupales en entornos como sesiones de formación o talleres, permitiendo a los participantes unirse mediante un código QR. Además, la tecnología puede aprender y adaptarse a vocabulario personalizado, como términos específicos de la industria y nombres de empresas y personas.
Declaraciones del CEO
“Después de pasar tantos años en la traducción de texto, la voz era un paso natural para nosotros”, dijo Jarek Kutylowski, CEO de DeepL. “Hemos avanzado mucho en cuanto a la traducción de texto y documentos. Pero pensamos que no había un gran producto para la traducción de voz en tiempo real”.
Kutylowski señaló que los desafíos en la creación de un producto de traducción en tiempo real se centran en lograr un equilibrio entre reducir la latencia —el retraso entre que alguien habla y se reproduce el audio traducido— y mantener resultados precisos.
Tecnología Subyacente y Futuro
DeepL afirmó que controla toda la pila de voz a voz. Sin embargo, el sistema actual convierte el habla en texto, aplica la traducción y luego convierte eso nuevamente en habla. La empresa cree que, dado que ha trabajado en la traducción de texto durante años, tiene una ventaja en la calidad de la traducción. De cara al futuro, la empresa quiere desarrollar un modelo de traducción de voz de extremo a extremo que omita por completo el paso de texto.

API y Casos de Uso Empresarial
La compañía también está lanzando una API que permite a desarrolladores externos y empresas construir sobre la tecnología de DeepL para casos de uso personalizados, como centros de llamadas. Kutylowski destacó que la IA está reinventando cómo será el servicio al cliente en los próximos años, y una capa de traducción ayuda a las empresas a brindar soporte en idiomas donde el personal calificado es escaso y costoso de contratar.
Competencia en el Mercado
DeepL se enfrenta a la competencia de varias startups bien financiadas que trabajan en espacios adyacentes:
- Sanas: que el año pasado recaudó $65 millones de Quadrille Capital con la participación de Teleperformance, utiliza IA para modificar el acento de un hablante en tiempo real, una herramienta dirigida principalmente a agentes de centros de llamadas.
- Camb.AI: con sede en Dubai, se centra en la síntesis y traducción del habla para empresas de medios y entretenimiento, ayudándoles a doblar y localizar contenido de video a escala.
- Palabra: respaldada por la firma Seven Seven Six del cofundador de Reddit, Alexis Ohanian, está construyendo un motor de traducción de voz en tiempo real diseñado para preservar tanto el significado como la voz original del hablante, poniéndola en competencia más directa con lo que DeepL está construyendo.
La tecnología de traducción de voz de DeepL promete transformar la comunicación global, eliminando barreras idiomáticas en tiempo real.