Estudiantes coreanos desafían a gigantes tecnológicos con modelo de voz sintética
Dos universitarios sin experiencia previa en IA avanzada han desarrollado Dia NotebookLM, un modelo de generación de voz con 1.600 millones de parámetros que compite con herramientas como Google NotebookLM y ElevenLabs. Utilizando los chips TPU de Google a través de su programa de investigación, Toby Kim y su compañero crearon esta solución en solo tres meses.

Características innovadoras
- Personalización avanzada: Control de tonos, risas y sonidos no verbales
- Clonación vocal: Replica voces con muestras de audio
- Accesibilidad: Funciona en PCs con 10GB de VRAM
Potencial y controversias
Aunque el modelo disponible en Hugging Face y GitHub muestra calidad competitiva, plantea riesgos:
- Falta de salvaguardas contra desinformación
- Posible uso de contenido protegido para entrenamiento
- Responsabilidad limitada ante usos ilícitos

El futuro de Nari Labs
El equipo planea:
- Ampliar soporte a otros idiomas
- Publicar informe técnico detallado
- Desarrollar plataforma social alrededor del modelo