标签:逻辑推理

Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限

这篇文章介绍了一位网友在测试谷歌Gemini 1.5 Pro时的有趣经历。该网友故意在编写网页代码时留下了3个bug,并录制了相关视频。随后将代码库和视频一起输送给G...

GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智

摘要:谷歌DeepMind和斯坦福的研究人员发现,大模型在处理逻辑推理任务时,信息呈现的顺序对模型表现有显著影响。研究表明,当信息按逻辑顺序排列时,模型表...

当前大模型的能力边界

深入探讨了大型语言模型的能力边界及其在理解、逻辑推理、提示词互动和未来发展方向上的挑战。
1 2