Nari Labs revoluciona la IA de voz con Dia NotebookLM: Un modelo accesible y personalizable

Estudiantes coreanos desafían a gigantes tecnológicos con modelo de voz sintética

Dos universitarios sin experiencia previa en IA avanzada han desarrollado Dia NotebookLM, un modelo de generación de voz con 1.600 millones de parámetros que compite con herramientas como Google NotebookLM y ElevenLabs. Utilizando los chips TPU de Google a través de su programa de investigación, Toby Kim y su compañero crearon esta solución en solo tres meses.

Proceso de generación de voz IA

Diagrama que explica el flujo de trabajo de modelos de voz IA (Imagen referencial)

Características innovadoras

  • Personalización avanzada: Control de tonos, risas y sonidos no verbales
  • Clonación vocal: Replica voces con muestras de audio
  • Accesibilidad: Funciona en PCs con 10GB de VRAM

Potencial y controversias

Aunque el modelo disponible en Hugging Face y GitHub muestra calidad competitiva, plantea riesgos:

  • Falta de salvaguardas contra desinformación
  • Posible uso de contenido protegido para entrenamiento
  • Responsabilidad limitada ante usos ilícitos

Comparativa con modelos de voz existentes

Arquitectura de modelos neuronales de texto a voz (Imagen comparativa)

El futuro de Nari Labs

El equipo planea:

  • Ampliar soporte a otros idiomas
  • Publicar informe técnico detallado
  • Desarrollar plataforma social alrededor del modelo

Comparte este artículo

Otras notas de tu interés:

Tecnologia

Meta AI se integra en Threads: una función similar a Grok de X llega en beta a Asia y América Latina

Bienestar y Salud Mental

Madre que confesó haber ahogado a su hijo autista enfrenta nuevo juicio en Miami

Noticia Local

Ceremonia de los Premios Silver Knight Miami 2026: Celebrando la Excelencia Estudiantil

Noticia Local

Congresistas de Florida Exigen a Mayorkas Información sobre Retrasos en Controles Fronterizos

Negocios

Dessn levanta $6 millones para transformar el diseño impulsado por IA en producción

Politica

Seton Hall investiga filtración relacionada con abuso y ex presidente

Economia

Amazon Ring confía en Vapi AI: la startup de voz alcanza una valoración de $500 millones

Economia

Revisión de la Ley de Migración y Ciudadanía en Cuba 2024: Mantiene Restricciones Clave para Cubanoamericanos

Tecnologia

Thinking Machines presenta modelos de interacción: la IA que te interrumpe en tiempo real

Economia

Robinhood prepara segundo fondo de inversión en startups y proceso de IPO para RVII