标签:模型架构

复现 Sora 的方法及路径分析

本文深入探讨了Sora的核心技术原理、实现方法,并对其未来发展进行展望。Sora采用了高质量的数据集,结合UE数据,通过深度神经网络学习三维空间的物理规律。...

零一万物Yi-VL多模态大模型开源,MMMU、CMMMU两大权威榜单领先

零一万物公司于1月22日发布了Yi-VL多模态语言大模型,该模型基于Yi语言模型开发,包括Yi-VL-34B和Yi-VL-6B两个版本。Yi-VL模型在英文数据集MMMU和中文数据集C...

Amphion:最全能的开源AI音频项目,在音频商业化方面有极大的帮助

Amphion是一个面向音频、音乐和语音生成的工具包,旨在支持可复制研究,并帮助初级研究人员和工程师进入音频、音乐和语音生成领域。它提供了多种功能,包括TT...
1 2