标签:奖励假设

汪军对话 Rich Sutton:大模型在一定程度上分散了我们对智能理解的注意力

在 RL China 2025 开幕式的思想对话中,图灵奖得主、“强化学习之父”Richard Sutton 与伦敦大学学院汪军教授共探智能的本质与未来方向。Richard 认为大模型缺...