国内首款AI音乐大模型一曲封神！核心技术业内首公开，爆改霉霉周杰伦效果惊艳

AIGC动态1年前 (2024)发布 AIera

2,408 0 0

文章摘要

【关键词】 音乐AI、情感AGI、技术公开、歌曲生成、市场前景

国内首个音乐ChatGPT，「天工SkyMusic」，已经开启内测，引起了编辑部的极大关注。

这款AI音乐生成大模型以其高质量的音乐品质和逼真的人声合成技术，让整个编辑部感到震撼。

它不仅能够生成具有中文特色的歌曲，还能够通过歌词控制歌曲的情绪变化，展现出主歌和副歌、前奏和主歌的段落差异。

此外，「天工SkyMusic」还能够参考特定音频学习特定的曲风，创作出多样化的音乐作品。

「天工SkyMusic」的研发团队在项目初期面临了技术路径的选择，最终决定采用音频方案而非MIDI方案，尽管这意味着巨大的风险。

幸运的是，他们的赌注获得了成功。

他们采用的核心技术架构是基于MoE架构的4000亿级参数多模态超级大模型「天工3.0」，这一技术路径在业界尚无公开资料可参考，因此他们的成功尤为难能可贵。

在技术层面，「天工SkyMusic」的Large-scale Transformer负责谱曲，控制音乐结构和风格，而Diffusion Transformer则负责演唱，通过LDM技术将Music Patches转换为高质量音频输出。

这使得「天工SkyMusic」在音乐情感的捕捉上极为细腻，能够根据歌词和音乐元素生成不同情感氛围的作品。

与市面上的其他AI音乐工具如Suno等相比，「天工SkyMusic」在中文人声合成、音乐风格控制、情感表达等方面具有明显优势。

然而，尽管AI音乐生成技术正在快速发展，但它并不意味着AI会完全取代音乐人。

相反，AI可以降低音乐创作的门槛，拓展音乐创作者群体，激发多元的音乐形态和跨界合作。

同时，AI音乐生成工具可以赋能音乐创作者，提高创作效率。

昆仑万维的研究团队在开发「天工SkyMusic」的过程中，不仅关注技术层面的创新，更强调模型对音乐情感色彩的感知和再现能力。

他们希望通过自研技术，帮助创作者更好地通过AI技术表达和传递情感内涵。

展望未来，随着AI技术的进步，将有越来越多的人通过AI音乐表达自我，音乐市场将迎来新的增长和发展。

原文和模型

【原文链接】 阅读原文 [ 3923字 | 16分钟 ]
【原文作者】 新智元
【摘要模型】 gpt-4
【摘要评分】 ★★★★☆

OpenAI GPT-4

GPT-4是OpenAI公司开发的自然...

# AIGC动态 # GPT-GPTs # 大模型 # 音频生成 # Azure # gpt-4 # 市场前景 # 情感AGI # 技术公开 # 新智元 # 歌曲生成 # 音乐AI

文章版权归作者所有，未经允许请勿转载。

OpenAI 重磅推出的 GPT Store，上线 2 个月就要凉了？

admin

2,770

三行命令，大模型让 Excel 直接回答问题

AI前线

2,525

借「AI 东风」，智能戒指可能是下一个 Apple Watch

极客公园

2,512

Reddit IPO首日大涨48%，社交媒体卖用户数据第一股，股民追捧但Altman投资却差点亏本

新智元

1,744

「降价增配」的华为智界 S7，能不能打过小米 SU7？

极客公园

2,500

Llama 3被爆7月解禁剑指GPT-4，最大参数超1400亿！2名核心团队成员却离职

新智元

2,293

暂无评论

暂无评论...

国内首款AI音乐大模型一曲封神！核心技术业内首公开，爆改霉霉周杰伦效果惊艳

文章摘要

原文和模型

OpenAI 重磅发布的GPT-4 Turbo with Vision，是编码的倒退

面壁智能完成数亿元新融资，华为哈勃领投，北京AI产投基金跟投｜钛媒体AGI

相关文章

暂无评论

热门网址

热门文章

国内首款AI音乐大模型一曲封神！核心技术业内首公开，爆改霉霉周杰伦效果惊艳

文章摘要

原文和模型

OpenAI 重磅发布的GPT-4 Turbo with Vision，是编码的倒退

面壁智能完成数亿元新融资，华为哈勃领投，北京AI产投基金跟投｜钛媒体AGI

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章