“MoE技术”的搜索结果

MiniMax 视频生成模型首秀!闫俊杰:大模型的研发核心是“快”
MiniMax视频生成模型video-01的首次展示标志着该公司在多模态内容处理领域的进一步发展。创始人闫俊杰强调,大模型的核心在于高效处理信...
真把自己「当个人」的AI,扫去了我的社交贫困
快手推出的虚拟社交App“飞船”通过其超拟人策略,为用户带来了全新的社交体验。该应用中的智能体不仅能够进行文本回复,还能主动发送图像...
昆仑万维开源 2 千亿稀疏大模型天工 MoE,全球首创能用 4090 推理
昆仑万维宣布开源其千亿稀疏大模型Skywork-MoE,此模型基于先前的Skywork-13B模型中间checkpoint扩展而成,是首个将MoE Upcycling技术应...
MoE 高效训练的 A/B 面:与魔鬼做交易,用「显存」换「性能」
本文介绍了MoE(混合专家)作为一种模块化的稀疏激活技术在大型模型训练中的应用。MoE通过将模型参数划分为多个专家子模块,每个输入仅...
搞AI的是真没钱了
近日,一个由MIT、普林斯顿等研究机构的华人团队发布了自己的大模型JetMoE,声称仅需10万美元的成本就能训练出与数十亿美元成本的LLaMA2...