标签:模型优化
MoE推理「王炸」组合:昇腾×盘古让推理性能狂飙6-8倍
华为团队推出的Pangu Pro MoE 72B模型在昇腾平台上实现了显著的推理性能提升,通过系统级软硬协同优化,推理性能提升6~8倍。该模型采用混合专家(MoE)架构,...
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号
复刻DeepSeek - R1的长思维链推理使大模型强化学习新范式RLIF成为热门话题。UC Berkeley团队提出的新方法Intuitor,仅通过优化模型自己的信心,就能让大模型...
博士宿舍激情脑暴,革新了Scaling Law?Qwen和浙大联手推出新定律,直接干掉95.5%推理内存!
阿里巴巴研究团队与浙江大学合作提出了一种新的并行计算缩放定律(ParScale),该定律通过在训练和推理阶段增加并行计算量,显著提升大模型的能力,同时保持...
清华&通院推出”绝对零”训练法,零外部数据大模型自我博弈解锁推理能力
“绝对零”是一种通过自我博弈训练预训练大模型的新方法,旨在提升模型的推理能力。该方法由清华、北京通用人工智能研究院和宾夕法尼亚州立大学的研究人员提出...
阿里开源R1-Omni,多模态情感识别
阿里巴巴通义实验室的研究人员开源了多模态情感识别模型R1-Omni,该模型首次将强化学习与可验证奖励(RLVR)应用于多模态大模型,显著提升了情感识别任务中的...
字节首次公开图像生成基模技术细节!数据处理到RLHF全流程披露
字节跳动旗下的豆包大模型团队近期在 arXiv 上发布了一篇技术报告,详细介绍了其文生图模型 Seedream 2.0 的技术细节。该模型于去年 12 月上线至豆包 APP 和...
团队“DeepSeek”化!字节 Seed Edge启动不足两月,冲刺AGI再发新作,训练成本再节省40%
字节跳动正式设立了代号为“Seed Edge”的研究项目,旨在探索通用人工智能(AGI)的新方法。该项目团队近期发布了一项名为Comet的关键优化技术,该技术针对MoE...
腾讯元宝连夜修改用户协议!“霸王”条款冲上热榜,你的内容到底谁说了算?
腾讯旗下的AI应用元宝在3月4日登顶苹果中国区应用商店免费App下载排行榜,引发了广泛关注。然而,其用户服务协议中的“知识产权与其他权利”条款也引发了争议。...
DeepSeek推出后,移动端AI风向要变
高通凭借系统级芯片设计构建了技术护城河,其异构计算架构整合了NPU、GPU与低功耗子系统,能在保持设备续航的同时处理复杂推理任务。通过AI软件栈和开发者生...
周五畅聊:大家都用 DeepSeek R1 做了啥?
DeepSeek R1自发布以来,开发者们在实际应用中面临了一系列挑战和调整。与以往的非推理模型如GPT-4o、Claude-3.5相比,R1在思考链、响应时间和幻觉问题上需要...