震惊！Stability AI发布全新音频模型，6分钟创作完整歌曲！

编者按：AI生成音乐的赛道正进入“军备竞赛”阶段。Stability AI今天发布了Stability Audio 3.0系列，其中最顶配模型能生成超过六分钟的“专业级”音乐，这在技术上是一次不小的飞跃，尤其是相较于它2024年发布的版本，时长翻了一倍还多。更关键的是，公司这次采取了分级开源策略：小模型和中等规模模型向开发者开放权重，而旗舰型号则仅供API和付费服务——这种模式很考验社区的接受度和商业转化能力。与此同时，整个行业正被版权问题所困扰，Suno和Udio的官司就是前车之鉴；Stability AI聪明地强调，其训练数据“完全获得授权”，还拉来了华纳和环球音乐集团站台，这或许会成为它稳稳立足的关键。以下为你带来了这篇文章的中文解读。

Stability AI——打造Stable Diffusion的那家公司——今天正式推出新一代音频模型系列Stability Audio 3.0。公司宣称，其中的顶级模型能够生成超过六分钟的“专业级”音乐，长度和质量都达到新高度。

此次共发布四个模型：小型音效模型（4.59亿参数）、小型通用模型（4.59亿参数）、中型模型（14亿参数）和大型模型（27亿参数）。其中两个小型模型适合在设备端本地运行，可生成最长两分钟的音效或音乐。

中型和大型模型则能创作完整的六分二十秒作品，音乐结构和旋律基调都能保持稳定。这一时长是Stability AI在2024年发布的Stable Audio 2.0的两倍以上——后者的生成上限不过三分钟。

值得关注的是，Stability AI将小型音效、小型通用和中型模型以开放权重形式发布，任何人都可以自由使用或修改。相比之下，公司在2024年推出的Stable Audio Open仅支持最长47秒的音乐生成，这次的新系列显然是巨大升级。

大型模型则只能通过API和自托管付费服务获取。此外，年收入超过一百万美元的企业必须申请企业牌照才能使用。

谷歌、ElevenLabs等众多公司也都在推出音乐生成模型和工具。但正如Suno和Udio正在打的官司所证明的那样，数据授权以及与唱片公司的合作，对于这类服务的长期生存至关重要。

去年，Stability AI已经与华纳音乐集团和环球音乐集团签署协议，共同开发模型和音乐创作工具。公司表示，最新这一代音频模型是基于完全获得授权的数据训练而成。

这家AI初创公司正在为专业音乐人打造一套新产品线，但暂未透露具体功能细节。前Universal Audio和Fender的首席数字官Ethan Kaplan已加入Stability AI，将主导公司的专业音乐业务。

越来越多的AI公司选择聘请音乐行业高管来增强自身信用。今年早些时候，Suno挖来了前Merlin首席执行官Jeremy Sirota担任首席商务官；ElevenLabs也从独立音乐发行商Kobalt聘请了Derek Cournoyer，担任其音乐业务的战略主管。

本文由吉伊网原创发布，未经许可，不得转载！
本文链接：http://www.jkiyi.com/kx/41438.html

震惊！Stability AI发布全新音频模型，6分钟创作完整歌曲！

发表评论取消回复

联系我们

震惊！Stability AI发布全新音频模型，6分钟创作完整歌曲！

发表评论 取消回复

相关推荐

联系我们

发表评论取消回复