标签:动态计算

中科院、百度提出新架构:突破参数限制,实现高效推理

针对大模型参数规模扩大与性能提升不匹配的挑战,中国科学院信息工程研究所联合百度与北京师范大学AI学院提出了Inner Thinking Transformer架构(ITT)。该架...