从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型
文章摘要
【关 键 词】 音乐AIGC、天工SkyMusic、大模型技术、音乐创作、技术创新
昆仑万维近日发布了全球最大规模的开源MOE大模型「天工3.0」,并基于此打造了国内首个公开可用的AI音乐生成大模型「天工SkyMusic」。这款音乐大模型在多个性能方面超越了国际同类产品,成为中国首个音乐AIGC SOTA模型,标志着AI音乐生成技术在中国的重大突破。
「天工SkyMusic」的使用过程非常简单,用户只需输入歌名和歌词,选择参考歌曲,即可生成风格相近、嗓音神似的全新作品。这项技术不仅降低了音乐创作的技术门槛,让普通用户也能享受创作音乐的乐趣,而且在中文歌曲领域表现出色,尤其在方言歌曲生成能力上具有显著优势。
音乐数据的处理复杂性一直是AI音乐生成技术的挑战之一,但随着AI大模型技术的演进,已经找到了有效的技术路径。昆仑万维选择了大模型音乐音频生成路线,并攻坚人声Song领域,最终自主研发出适用于音乐音频领域的类Sora模型架构,填补了行业空白。此外,为了训练「天工SkyMusic」,昆仑万维建立了全球最大的音乐数据集,确保了模型在音乐风格上的精准可控和广泛适用。
「天工3.0」大模型是「天工SkyMusic」成功的关键技术支撑。它拥有4000亿参数,性能全面超越其他同类模型,不仅在语义理解、逻辑推理等领域有惊人的性能提升,还具备了独立思考能力。作为多模态大模型,「天工3.0」集成了AI搜索、AI写作、AI长文本阅读、AI图片生成等功能,能够为用户提供前所未有的AI应用体验。
昆仑万维的战略是“All in AGI 与 AIGC”,旨在通过技术赋能,降低创作门槛,扩大内容创作者群体,提升个性化内容的生产量与丰富度,满足大众对于优质内容的消费需求。公司还计划利用AI技术打破传统内容创作壁垒,让不同文化和语言群体都能在AI UGC平台上轻松传达自身的故事与情感,促进全球文化平权。
昆仑万维正全力推进AI UGC平台建设,结合技术创新与商业模式创新,探索适合市场的增长路径。公司致力于构建一个包容性强、参与度广、创新能力出众的AI内容生态,引领行业迈向一个崭新的时代。
原文和模型
【原文链接】 阅读原文 [ 3774字 | 16分钟 ]
【原文作者】 AI科技评论
【摘要模型】 gpt-4
【摘要评分】 ★★★★★