从 0 到 1，揭秘中国首个 AI 音乐 SOTA 模型

AIGC动态1年前 (2024)发布 aitechtalk

2,607 0 0

文章摘要

【关键词】 音乐AIGC、天工SkyMusic、大模型技术、音乐创作、技术创新

昆仑万维近日发布了全球最大规模的开源MOE大模型「天工3.0」，并基于此打造了国内首个公开可用的AI音乐生成大模型「天工SkyMusic」。这款音乐大模型在多个性能方面超越了国际同类产品，成为中国首个音乐AIGC SOTA模型，标志着AI音乐生成技术在中国的重大突破。

「天工SkyMusic」的使用过程非常简单，用户只需输入歌名和歌词，选择参考歌曲，即可生成风格相近、嗓音神似的全新作品。这项技术不仅降低了音乐创作的技术门槛，让普通用户也能享受创作音乐的乐趣，而且在中文歌曲领域表现出色，尤其在方言歌曲生成能力上具有显著优势。

音乐数据的处理复杂性一直是AI音乐生成技术的挑战之一，但随着AI大模型技术的演进，已经找到了有效的技术路径。昆仑万维选择了大模型音乐音频生成路线，并攻坚人声Song领域，最终自主研发出适用于音乐音频领域的类Sora模型架构，填补了行业空白。此外，为了训练「天工SkyMusic」，昆仑万维建立了全球最大的音乐数据集，确保了模型在音乐风格上的精准可控和广泛适用。

「天工3.0」大模型是「天工SkyMusic」成功的关键技术支撑。它拥有4000亿参数，性能全面超越其他同类模型，不仅在语义理解、逻辑推理等领域有惊人的性能提升，还具备了独立思考能力。作为多模态大模型，「天工3.0」集成了AI搜索、AI写作、AI长文本阅读、AI图片生成等功能，能够为用户提供前所未有的AI应用体验。

昆仑万维的战略是“All in AGI 与 AIGC”，旨在通过技术赋能，降低创作门槛，扩大内容创作者群体，提升个性化内容的生产量与丰富度，满足大众对于优质内容的消费需求。公司还计划利用AI技术打破传统内容创作壁垒，让不同文化和语言群体都能在AI UGC平台上轻松传达自身的故事与情感，促进全球文化平权。

昆仑万维正全力推进AI UGC平台建设，结合技术创新与商业模式创新，探索适合市场的增长路径。公司致力于构建一个包容性强、参与度广、创新能力出众的AI内容生态，引领行业迈向一个崭新的时代。