Nari Labs revoluciona la IA de voz con Dia NotebookLM: Un modelo accesible y personalizable

Estudiantes coreanos desafían a gigantes tecnológicos con modelo de voz sintética

Dos universitarios sin experiencia previa en IA avanzada han desarrollado Dia NotebookLM, un modelo de generación de voz con 1.600 millones de parámetros que compite con herramientas como Google NotebookLM y ElevenLabs. Utilizando los chips TPU de Google a través de su programa de investigación, Toby Kim y su compañero crearon esta solución en solo tres meses.

Proceso de generación de voz IA

Diagrama que explica el flujo de trabajo de modelos de voz IA (Imagen referencial)

Características innovadoras

  • Personalización avanzada: Control de tonos, risas y sonidos no verbales
  • Clonación vocal: Replica voces con muestras de audio
  • Accesibilidad: Funciona en PCs con 10GB de VRAM

Potencial y controversias

Aunque el modelo disponible en Hugging Face y GitHub muestra calidad competitiva, plantea riesgos:

  • Falta de salvaguardas contra desinformación
  • Posible uso de contenido protegido para entrenamiento
  • Responsabilidad limitada ante usos ilícitos

Comparativa con modelos de voz existentes

Arquitectura de modelos neuronales de texto a voz (Imagen comparativa)

El futuro de Nari Labs

El equipo planea:

  • Ampliar soporte a otros idiomas
  • Publicar informe técnico detallado
  • Desarrollar plataforma social alrededor del modelo

Comparte este artículo

Otras notas de tu interés:

Negocios

Google facilita la migración a Gemini con herramientas para transferir chats y datos personales

Politica

El Departamento de Energía desalojará al Departamento de Educación de su sede histórica

Politica

Wikipedia prohíbe la edición de textos generados por inteligencia artificial

Sociedad y Cultura

Social Media en el Banquillo: La Crisis de Big Tech y las Tendencias de Evaluación

Politica

Senado de EE.UU. exige recopilación de datos sobre consumo energético de centros de datos

Negocios

OpenAI detiene indefinidamente el desarrollo del modo erótico de ChatGPT

Noticia Local

Miami Traslada su Ayuntamiento a Miami Freedom Park: Futuro Incierto para el Histórico Edificio Pan Am

Politica

Fracasa el intento respaldado por Trump de derogar la redistritación en Utah

Deportes

El Debate Olímpico: Prohibición y Participación de Atletas Transgénero en Deportes Femeninos

Espectáculos y Entretenimiento

ByteDance revoluciona la creación de contenido con el lanzamiento de Dreamina Seedance 2.0 en CapCut