Stability AI presenta Stability Audio 3.0: modelos que generan canciones de más de seis minutos

Stability Audio 3.0: la nueva familia de modelos de audio

Stability AI, la compañía detrás de Stable Diffusion, ha lanzado una nueva familia de modelos de audio llamada Stability Audio 3.0. El modelo más avanzado puede generar música de calidad profesional con una duración superior a los seis minutos, según confirmó la empresa.

Detalles de los modelos

Se lanzan cuatro modelos bajo el nombre Stable Audio 3.0: small SFX (459 millones de parámetros), small (459 millones), medium (1.4 mil millones) y large (2.7 mil millones). Los modelos small están diseñados para generación de sonido y música en el propio dispositivo con una duración de hasta dos minutos.

Los modelos medium y large pueden crear composiciones completas de 6 minutos con 20 segundos, manteniendo la estructura musical y el tono melódico. Esto representa más del doble de la duración que podía generar Stable Audio 2.0, lanzado en 2024.

Disponibilidad y licencias

Stability AI ha puesto a disposición los modelos small SFX, small y medium con pesos abiertos para que cualquiera pueda usarlos y modificarlos. En 2024 la compañía lanzó Stable Audio Open, que permitía generar música de hasta 47 segundos; la nueva familia supone un gran salto respecto a las versiones abiertas anteriores.

El modelo large está disponible únicamente a través de la API y servicios de pago de auto-alojamiento. Además, las empresas con ingresos superiores a 1 millón de dólares necesitarán una licencia empresarial.

Alianzas y datos con licencia

Stability AI ha firmado acuerdos con Warner Music Group y Universal Music Group para desarrollar modelos y herramientas de creación musical. La empresa asegura que su último conjunto de modelos de audio se basa en datos totalmente bajo licencia, un factor crucial en un contexto donde Suno y Udio enfrentan batallas judiciales por derechos de autor.

La startup de inteligencia artificial está desarrollando una nueva suite de productos para músicos profesionales, aunque no ofreció más detalles sobre sus características. Ethan Kaplan, exdirector digital de Universal Audio y Fender, se une a la compañía para liderar la oferta musical profesional de Stability.

Persona usando tablet interactuando con un robot, simbolizando la colaboración humano-IA
La colaboración entre humanos e inteligencia artificial es clave en el desarrollo de herramientas como Stability Audio 3.0.

Competencia en el mercado

Varias empresas, incluyendo Google y ElevenLabs, están lanzando modelos y herramientas en torno a la generación de música. Sin embargo, como han demostrado los litigios en curso contra Suno y Udio, la concesión de licencias de datos y las alianzas con sellos discográficos podrían convertirse en una parte clave para la supervivencia a largo plazo de estos servicios.

El movimiento de Stability AI al contratar a ejecutivos de la industria musical (como Kaplan) refleja una tendencia: Suno contrató al exdirector ejecutivo de Merlin, Jeremy Sirota, como director comercial, y ElevenLabs incorporó a Derek Cournoyer, de la editorial independiente Kobalt, como líder estratégico para su negocio musical.

Comparte este artículo

Otras notas de tu interés:

Economia

Startup Battlefield 200: Cierre de Aplicaciones el 27 de Mayo – ¡No Pierdas tu Oportunidad!

Economia

OpenAI acelera su salida a bolsa para septiembre tras la demanda fallida de Elon Musk

Economia

James Murdoch compra Vox Media y New York Magazine: un acuerdo clave en la industria mediática

Negocios

OpenAI da un paso estratégico: adquiere TBPN, el talk show de moda en Silicon Valley

Negocios

Última semana para aplicar a Startup Battlefield 200: $100,000 en juego

Economia

NanoClaw: Startup de ciberseguridad recauda $12 millones y rechaza oferta de $20 millones

Bienestar y Salud Mental

Hollywood y la Ansiedad Política en California: La Crisis que Resuena en Incendios y Resiliencia

Economia

Los centros de datos se convierten en un tema clave en la carrera por la gobernación de Georgia

Tecnologia

Google anuncia audífonos inteligentes con reconocimiento de voz en Google I/O 2026

Tecnologia

Google Gemini se renueva en el I/O 2026: Daily Brief, diseño ‘Neural Expressive’ y el agente Gemini Spark para competir con ChatGPT y Claude