国内首个音乐版「ChatGPT」来了!Sora同款架构,唱作技巧全面发展,还剧透了全新MoE大模型

AI-Agent9个月前发布 QbitAI
941 0 0
国内首个音乐版「ChatGPT」来了!Sora同款架构,唱作技巧全面发展,还剧透了全新MoE大模型

 

文章摘要


【关 键 词】 AI音乐天工SkyMusic情感AGI超级大模型技术细节

昆仑万维近期宣布了其AI音乐生成大模型「天工SkyMusic」的开放邀测,这一模型基于公司的「天工3.0」超级大模型构建。这个模型的亮点在于其情感表达能力,特别是在中文发音方面的清晰度和自然度,这使得它在音乐生成领域具有竞争力。它支持多种音乐风格,并能够根据用户输入的歌词风格生成相应的歌曲。

「天工SkyMusic」采用了类Sora模型架构,包括Large-scale Transformer和Diffusion Transformer,这使得它能够生成高质量的音乐音频。此外,它还具备歌词段落控制和多种歌唱技巧学习的能力,进一步增强了音乐的情感表达。

「天工3.0」大模型本身也是一个值得关注的焦点,它是一个4000亿级参数的MoE混合专家模型,预计将在4月17日开启公测并同步开源。这个模型在语义理解、逻辑推理、通用性、泛化性、不确定性知识和学习能力等方面都有显著的性能提升。它还新增了搜索增强、研究模式、代码调用和图表绘制等能力,以及专项Agent训练,以应对更复杂的需求。

「天工3.0」被描述为一个多模态的“超级模型”,集成了AI搜索、写作、阅读、对话、语音合成、图片生成、漫画创作、图片识别、音乐生成、代码写作和表格生成等多项能力。这表明昆仑万维正在朝着构建一个全面的AI生态系统迈进,其产品线涵盖了AI搜索、音乐、社交、动漫和游戏等多个领域。

昆仑万维的战略是“All in AGI 和 AIGC”,即全面投入到通用人工智能和AI生成内容的领域。公司已经推出了多个基于「天工」系列大模型的前沿AI产品,包括AI搜索产品、多模态大模型、大语言模型、AI Agent开发平台以及大模型更新。这些成就显示了昆仑万维在模型技术和工程能力方面的实力,以及其在人工智能领域全面布局的野心。

随着「天工3.0」的即将公测,业界对它能够带来的新体验充满期待。昆仑万维的这一系列动作不仅展示了其在AI领域的技术实力,也预示着AI在音乐创作和其他创意产业中的应用将变得更加广泛和深入。

原文和模型


【原文链接】 阅读原文 [ 2427字 | 10分钟 ]
【原文作者】 量子位
【摘要模型】 gpt-4
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...