震惊!Stability AI发布全新音频模型,6分钟创作完整歌曲!

编者按:AI生成音乐的赛道正进入“军备竞赛”阶段。Stability AI今天发布了Stability Audio 3.0系列,其中最顶配模型能生成超过六分钟的“专业级”音乐,这在技术上是一次不小的飞跃,尤其是相较于它2024年发布的版本,时长翻了一倍还多。更关键的是,公司这次采取了分级开源策略:小模型和中等规模模型向开发者开放权重,而旗舰型号则仅供API和付费服务——这种模式很考验社区的接受度和商业转化能力。与此同时,整个行业正被版权问题所困扰,Suno和Udio的官司就是前车之鉴;Stability AI聪明地强调,其训练数据“完全获得授权”,还拉来了华纳和环球音乐集团站台,这或许会成为它稳稳立足的关键。以下为你带来了这篇文章的中文解读。
Stability AI——打造Stable Diffusion的那家公司——今天正式推出新一代音频模型系列Stability Audio 3.0。公司宣称,其中的顶级模型能够生成超过六分钟的“专业级”音乐,长度和质量都达到新高度。
此次共发布四个模型:小型音效模型(4.59亿参数)、小型通用模型(4.59亿参数)、中型模型(14亿参数)和大型模型(27亿参数)。其中两个小型模型适合在设备端本地运行,可生成最长两分钟的音效或音乐。
中型和大型模型则能创作完整的六分二十秒作品,音乐结构和旋律基调都能保持稳定。这一时长是Stability AI在2024年发布的Stable Audio 2.0的两倍以上——后者的生成上限不过三分钟。
值得关注的是,Stability AI将小型音效、小型通用和中型模型以开放权重形式发布,任何人都可以自由使用或修改。相比之下,公司在2024年推出的Stable Audio Open仅支持最长47秒的音乐生成,这次的新系列显然是巨大升级。
大型模型则只能通过API和自托管付费服务获取。此外,年收入超过一百万美元的企业必须申请企业牌照才能使用。
谷歌、ElevenLabs等众多公司也都在推出音乐生成模型和工具。但正如Suno和Udio正在打的官司所证明的那样,数据授权以及与唱片公司的合作,对于这类服务的长期生存至关重要。
去年,Stability AI已经与华纳音乐集团和环球音乐集团签署协议,共同开发模型和音乐创作工具。公司表示,最新这一代音频模型是基于完全获得授权的数据训练而成。
这家AI初创公司正在为专业音乐人打造一套新产品线,但暂未透露具体功能细节。前Universal Audio和Fender的首席数字官Ethan Kaplan已加入Stability AI,将主导公司的专业音乐业务。
越来越多的AI公司选择聘请音乐行业高管来增强自身信用。今年早些时候,Suno挖来了前Merlin首席执行官Jeremy Sirota担任首席商务官;ElevenLabs也从独立音乐发行商Kobalt聘请了Derek Cournoyer,担任其音乐业务的战略主管。
本文由吉伊网原创发布,未经许可,不得转载!
本文链接:http://www.jkiyi.com/kx/41438.html