标签：奖励假设

汪军对话 Rich Sutton：大模型在一定程度上分散了我们对智能理解的注意力

在 RL China 2025 开幕式的思想对话中，图灵奖得主、“强化学习之父”Richard Sutton 与伦敦大学学院汪军教授共探智能的本质与未来方向。Richard 认为大模型缺...

AI-Agent

12小时前