标签：LLM研究

DeepSeek推理最高提速6倍！开源研究：加装「思维进度条」，计算量减少30%

来自特拉维夫大学的研究团队开发了一种新方法，能够监控和控制大型语言模型（LLM）中的思考路径长度。该方法通过引入“思维进度向量”（Thinking Progress Vect...

AIGC动态

2天前

GPT-4不是世界模型，LeCun双手赞同！ACL力证LLM永远无法模拟世界

根据新智元的报道，亚利桑那大学、微软、霍普金斯大学等机构最近联合发布了一篇论文，从实证角度对LLM作为世界模拟器的能力进行了否定。这项研究已经被ACL 20...

AIGC动态

1年前 (2024)

LLM的「母语」是什么？

在探索多语言大型语言模型（LLM）的内部工作机制时，研究人员好奇这些模型是否真的将英语作为其内部处理语言。来自洛桑联邦理工学院的研究人员对Llama 2家族...

AIGC动态

1年前 (2024)