标签:深谋远虑

Transformer本可以深谋远虑,但就是不做

这篇报道探讨了语言模型是否会规划未来token的问题。研究发现,虽然Transformer有能力预测未来token,但在实践中并不会这样做。人类在使用语言时会预测即将出...