字节音乐大模型炸场！Seed-Music发布，支持一键生成高质量歌曲、片段编辑等

AIGC动态12个月前发布 almosthuman2014

2,413 0 0

字节音乐大模型炸场！Seed-Music发布，支持一键生成高质量歌曲、片段编辑等

文章摘要

字节跳动公司最新发布的音乐大模型Seed-Music，通过其创新的统一框架和四大核心功能，正在重新定义AI音乐创作的边界。这个系统不仅能够生成高质量的音乐，还提供了前所未有的音乐编辑灵活性，满足了从音乐小白到资深音乐人的多元需求。

Seed-Music的核心功能包括Lyrics2Song、Lyrics2Leadsheet2Song、Music Editing和Singing Voice Conversion，覆盖了十种不同的音乐创作任务。它通过结合语言模型和扩散模型的优势，并处理符号音乐，解决了音乐信号的复杂性、评估标准的缺乏以及用户需求多样性等AI音乐生成领域的主要挑战。

在技术层面，Seed-Music采用了基于新型token和语言模型的方法，引入了一种能够根据不同用户输入生成专业生成内容（PGC）质量音乐的训练方法。它还提出了一种全新的基于扩散模型的方法，特别适合音乐编辑，并引入了一种在歌唱声音背景下的零样本声音转换的新颖方法。

Seed-Music的架构包括表征模型、生成器和渲染器三个核心组件，它们共同工作以生成高质量的音频波形。系统提供了三种适用于不同场景的中间表征：音频token、符号音乐token和声码器latent。这些表征的选择取决于用户的音乐创作任务。

Seed-Music的发布，不仅在技术上取得了突破，还在社交层面激发了新的创新场景。它将音乐生成自然地嵌入到不同创作群体的工作流中，使AI音乐具备了独特的社交属性。随着Seed-Music等技术的不断发展，未来可能会出现新的创作、欣赏和分享音乐的场景。

业界对Seed-Music的反应积极，音乐人对其生成的音乐质量给予了高度评价，并期待它能作为一项服务被广泛使用。Seed-Music的成功，预示着AI音乐生成技术在未来有着广阔的应用前景。