首个国产音乐SOTA模型来了！专为中文优化，免费用，不限曲风

AIGC动态2年前 (2024)发布 almosthuman2014

2,999 0 0

文章摘要

昆仑万维在其大模型“天工”的一周年之际，宣布了“天工 3.0”基座大模型和“天工 SkyMusic”音乐大模型的公测。

这一进展标志着人工智能在音乐创作领域的又一重要里程碑，尤其是在中文音乐生成方面的优化和创新。

“天工 SkyMusic”是专门针对中文优化的AI音乐生成模型，它不仅发音清晰、正宗，还支持多种方言。与现有的AI音乐工具如Suno相比，天工 SkyMusic在音质、自然度和可懂度等方面表现更佳，被认为是中国首个音乐AIGC的SOTA模型，使中国在AIGC领域走在了全球前列。

“天工 3.0”是支撑“天工 SkyMusic”成功的基座模型，它拥有4000亿参数，超越了其他知名模型如Grok-1，成为全球最大的开源MoE大模型。在多项权威多模态测评中，“天工 3.0”表现出色，超越了GPT-4V，全球领先。

使用“天工 SkyMusic”生成音乐的过程非常简单，用户只需输入歌名、歌词，选择参考曲目，模型就能生成风格和唱腔相似的歌曲。此外，模型还提供了“AI写词”功能，帮助用户完成歌词创作。天工 SkyMusic的独特之处在于它能够根据示例音源生成音乐，这极大地丰富了其应用场景。

技术上，“天工 SkyMusic”采用了端到端的音乐音频生成路线，直接学习并生成音频波形，而不是生成乐谱。这种方法虽然难度更大、成本更高，但提供了更直接、更高质量的音乐创作体验。昆仑万维在这一领域的研发投入巨大，构建了包含2000万首歌曲的数据集，并公开了其技术原理图，为行业提供了宝贵的参考。

“天工 3.0”在“独立思考”方面进行了重大升级，表现在多轮搜索与综合工具调用、图表绘制、研究模式、增强模式等功能上。这种能力的提升基于模型在语义理解、逻辑推理等方面的优化，使得AI能够更好地处理复杂问题，进行自主推理和创新性解决方案设计。

昆仑万维的愿景是通过AI工具提高人类社会的生产力和效率，同时帮助人们更好地理解和表达情感。他们希望通过“天工 SkyMusic”和“天工 3.0”等工具，降低创作门槛，让每个人都能更好地塑造和表达自我。未来，昆仑万维将构建一个AI UGC平台，帮助普通人和创作者完成IP创作的全闭环，推动内容行业的重塑和扩充，进入一个新的内容创作时代。