模型优化 | 学习AIGC

GPT-5 放弃追求智能上限了？

GPT-5的发布标志着OpenAI从追求基础模型智能突破转向了多任务性能优化的工程实践。尽管在编程、写作、数学等高频任务中实现了显著性能提升（如SWE-bench测试...

AIGC动态

3天前

DeepSeek推理最高提速6倍！开源研究：加装「思维进度条」，计算量减少30%

来自特拉维夫大学的研究团队开发了一种新方法，能够监控和控制大型语言模型（LLM）中的思考路径长度。该方法通过引入“思维进度向量”（Thinking Progress Vect...

AIGC动态

1个月前

干翻 GPT-4V 的面壁 8B「小钢炮」，被Nature 收录了

清华大学与面壁智能团队在边缘设备上成功实现了多模态大模型的落地，推出了MiniCPM-V系列模型，该系列包括MiniCPM-V 1.0、MiniCPM-V 2.0和MiniCPM-Llama3-V 2...

AIGC动态

1个月前

小米小爱同学：资源受限下，实现端侧大模型的高性能推理

随着大模型能力的持续提升，端侧设备部署成为产业界的重要工程挑战。手机、车载、IoT等设备对模型体积、推理时延、功耗和更新机制提出了极高要求，使得端侧推...

AIGC动态

2个月前

MoE推理「王炸」组合：昇腾×盘古让推理性能狂飙6-8倍

华为团队推出的Pangu Pro MoE 72B模型在昇腾平台上实现了显著的推理性能提升，通过系统级软硬协同优化，推理性能提升6~8倍。该模型采用混合专家（MoE）架构，...

AIGC动态

2个月前

AI仅凭“自信”学会推理，浙大校友复刻DeepSeek长思维链涌现，强化学习无需外部奖励信号

复刻DeepSeek - R1的长思维链推理使大模型强化学习新范式RLIF成为热门话题。UC Berkeley团队提出的新方法Intuitor，仅通过优化模型自己的信心，就能让大模型...

AIGC动态

2个月前

博士宿舍激情脑暴，革新了Scaling Law？Qwen和浙大联手推出新定律，直接干掉95.5%推理内存！

阿里巴巴研究团队与浙江大学合作提出了一种新的并行计算缩放定律（ParScale），该定律通过在训练和推理阶段增加并行计算量，显著提升大模型的能力，同时保持...

AIGC动态

3个月前

清华&通院推出”绝对零”训练法，零外部数据大模型自我博弈解锁推理能力

“绝对零”是一种通过自我博弈训练预训练大模型的新方法，旨在提升模型的推理能力。该方法由清华、北京通用人工智能研究院和宾夕法尼亚州立大学的研究人员提出...

AIGC动态

3个月前

阿里开源R1-Omni，多模态情感识别

阿里巴巴通义实验室的研究人员开源了多模态情感识别模型R1-Omni，该模型首次将强化学习与可验证奖励（RLVR）应用于多模态大模型，显著提升了情感识别任务中的...

AIGC动态

4个月前

字节首次公开图像生成基模技术细节！数据处理到RLHF全流程披露

字节跳动旗下的豆包大模型团队近期在 arXiv 上发布了一篇技术报告，详细介绍了其文生图模型 Seedream 2.0 的技术细节。该模型于去年 12 月上线至豆包 APP 和...

AIGC动态

5个月前

标签：模型优化

GPT-5 放弃追求智能上限了？

DeepSeek推理最高提速6倍！开源研究：加装「思维进度条」，计算量减少30%

干翻 GPT-4V 的面壁 8B「小钢炮」，被Nature 收录了

小米小爱同学：资源受限下，实现端侧大模型的高性能推理

MoE推理「王炸」组合：昇腾×盘古让推理性能狂飙6-8倍

AI仅凭“自信”学会推理，浙大校友复刻DeepSeek长思维链涌现，强化学习无需外部奖励信号

博士宿舍激情脑暴，革新了Scaling Law？Qwen和浙大联手推出新定律，直接干掉95.5%推理内存！

清华&通院推出”绝对零”训练法，零外部数据大模型自我博弈解锁推理能力

阿里开源R1-Omni，多模态情感识别

字节首次公开图像生成基模技术细节！数据处理到RLHF全流程披露

热门网址

标签：模型优化

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址