ChatGPT后，人工智能的终极里程碑却倒了

AIGC动态1年前 (2024)发布 almosthuman2014

2,798 0 0

文章摘要

艾伦·图灵在1950年的论文《计算机器与智能》中提出了“机器能思考吗？”的问题，并提出了一个“模仿游戏”，即后来广为人知的图灵测试，用以探讨机器是否具有思考能力。图灵测试的核心思想是，如果一台计算机在对话中让评判员无法区分其与人类的差别，那么它应被视为具有思考能力的实体。然而，图灵本人将图灵测试视为一种哲学思想实验，而非实际衡量机器智能的方法。

尽管图灵测试在公众认知中已成为评判人工智能智能的主要标准，但AI社区对通过图灵测试的标准并未达成一致。例如，图灵奖得主Geoffery Hinton认为，聊天机器人能够解释笑话为何有趣，可以视为其智能的标志。但其他科学家对此有不同看法。

图灵测试的具体实施也存在问题。图灵本人并未给出详细的操作指南，如测试应持续多长时间、允许提出什么类型的问题等。2014年，一款名为“尤金·古斯特曼”的聊天机器人在一场图灵测试比赛中成功欺骗了部分评判员，但AI专家对其是否真的通过了图灵测试持怀疑态度。

随着时间的推移，图灵测试的含义在公众讨论中逐渐演变，从最初的三人模仿游戏变为任何人与计算机之间的互动，只要计算机表现得足够像人类，就被视为通过了图灵测试。但这种定义与图灵的初衷相去甚远。

此外，图灵测试的焦点在于试图骗过人类，而非直接测试智能。许多AI研究人员认为图灵测试是一种干扰，是一种“不是为了让人工智能通过，而是为了人类失败”的测试。然而，图灵测试的重要性在大多数人眼中仍然占据主导地位。

人工智能的发展历史表明，能够流利交谈的智能体并不一定拥有类似人类的智能和其他心理特征。例如，IBM的DeepBlue使用一种与通用智能相去甚远的方法击败了世界国际象棋冠军。同样，许多曾被认为需要通用智能的任务，如语音识别、自然语言翻译、自动驾驶等，都可以由缺乏人类理解能力的机器完成。

神经科学领域的证据也表明，语言流利程度与认知的其他方面出奇地脱节。麻省理工学院神经科学家Ev Fedorenko等人的研究表明，语言生成能力背后的大脑网络与常识、推理等其他方面背后的网络大体上是分开的。

图灵在1950年的论文中预测，到本世纪末，人们将能够谈论机器思考，而不会遭到反驳。然而，我们还没有到达那个地步。真正的智能可能比图灵和我们所认识到的更复杂、更微妙。谷歌前CEO埃里克·施密特在斯坦福大学的演讲中提出，我们可能会有无法完全理解的知识系统，但我们理解它们的能力范围。这可能就是我们能够获得的最好结果。