标签:LLM研究

DeepSeek推理最高提速6倍!开源研究:加装「思维进度条」,计算量减少30%

来自特拉维夫大学的研究团队开发了一种新方法,能够监控和控制大型语言模型(LLM)中的思考路径长度。该方法通过引入“思维进度向量”(Thinking Progress Vect...

GPT-4不是世界模型,LeCun双手赞同!ACL力证LLM永远无法模拟世界

根据新智元的报道,亚利桑那大学、微软、霍普金斯大学等机构最近联合发布了一篇论文,从实证角度对LLM作为世界模拟器的能力进行了否定。这项研究已经被ACL 20...

LLM的「母语」是什么?

在探索多语言大型语言模型(LLM)的内部工作机制时,研究人员好奇这些模型是否真的将英语作为其内部处理语言。来自洛桑联邦理工学院的研究人员对Llama 2家族...