参数效率 | 学习AIGC

我们用世界名画和Meme“拷打”了智谱9B的视觉推理模型，结果出人意料

2025年上半年，AI开源领域的竞争聚焦于效率提升、多模态能力和智能体开发三大方向。参数规模不再是唯一追求，如何通过架构创新和训练方法优化实现“小模型强性...

AIGC动态

3个月前

针对大模型参数规模扩大与性能提升不匹配的挑战，中国科学院信息工程研究所联合百度与北京师范大学AI学院提出了Inner Thinking Transformer架构（ITT）。该架...

AIGC动态

7个月前

微软研究院和清华大学的研究人员提出了一种名为Differential Transformer（DIFF Transformer）的新模型架构，旨在改进Transformer模型中的注意力机制。该架构...

AIGC动态

12个月前

谷歌DeepMind的研究科学家Xu Owen He最近提出了一种名为PEER（参数高效专家检索）的新技术，该技术能够将混合专家（MoE）模型的专家数量扩展到百万级别，同时...

AIGC动态

1年前 (2024)