首个国产音乐SOTA模型来了!专为中文优化,免费用,不限曲风

首个国产音乐SOTA模型来了!专为中文优化,免费用,不限曲风

 

文章摘要


【关 键 词】 AI音乐天工3.0音频生成技术创新模型公测

昆仑万维在其大模型“天工”的一周年之际,宣布了“天工 3.0”基座大模型和“天工 SkyMusic”音乐大模型的公测。

这一进展标志着人工智能在音乐创作领域的又一重要里程碑,尤其是在中文音乐生成方面的优化和创新。

“天工 SkyMusic”是专门针对中文优化的AI音乐生成模型,它不仅发音清晰、正宗,还支持多种方言。与现有的AI音乐工具如Suno相比,天工 SkyMusic在音质、自然度和可懂度等方面表现更佳,被认为是中国首个音乐AIGC的SOTA模型,使中国在AIGC领域走在了全球前列。

“天工 3.0”是支撑“天工 SkyMusic”成功的基座模型,它拥有4000亿参数,超越了其他知名模型如Grok-1,成为全球最大的开源MoE大模型。在多项权威多模态测评中,“天工 3.0”表现出色,超越了GPT-4V,全球领先。

使用“天工 SkyMusic”生成音乐的过程非常简单,用户只需输入歌名、歌词,选择参考曲目,模型就能生成风格和唱腔相似的歌曲。此外,模型还提供了“AI写词”功能,帮助用户完成歌词创作。天工 SkyMusic的独特之处在于它能够根据示例音源生成音乐,这极大地丰富了其应用场景。

技术上,“天工 SkyMusic”采用了端到端的音乐音频生成路线,直接学习并生成音频波形,而不是生成乐谱。这种方法虽然难度更大、成本更高,但提供了更直接、更高质量的音乐创作体验。昆仑万维在这一领域的研发投入巨大,构建了包含2000万首歌曲的数据集,并公开了其技术原理图,为行业提供了宝贵的参考。

“天工 3.0”在“独立思考”方面进行了重大升级,表现在多轮搜索与综合工具调用、图表绘制、研究模式、增强模式等功能上。这种能力的提升基于模型在语义理解、逻辑推理等方面的优化,使得AI能够更好地处理复杂问题,进行自主推理和创新性解决方案设计。

昆仑万维的愿景是通过AI工具提高人类社会的生产力和效率,同时帮助人们更好地理解和表达情感。他们希望通过“天工 SkyMusic”和“天工 3.0”等工具,降低创作门槛,让每个人都能更好地塑造和表达自我。未来,昆仑万维将构建一个AI UGC平台,帮助普通人和创作者完成IP创作的全闭环,推动内容行业的重塑和扩充,进入一个新的内容创作时代。

原文和模型


【原文链接】 阅读原文 [ 3544字 | 15分钟 ]
【原文作者】 机器之心
【摘要模型】 gpt-4
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...