大神Karpathy炮轰复杂UI应用没有未来，Adobe首当其冲，网友：不提供文本交互，就是在阻挡AI浪潮

1,044 0 0

文章摘要

在人与AI高度协同的时代，Karpathy预言，仅依赖复杂UI界面的应用程序将面临淘汰，特别是Adobe和CAD等软件。他提出，复杂的UI界面无法与大模型形成有效的人机协同，无法满足准专业用户的“氛围式编程”需求。Karpathy根据UI和文本含量的不同，将常见应用划分为四个“风险等级”，并强调，尽管AI在UI操作上会进步，但开发者若停滞不前，仍无法取得好的发展。

Karpathy的观点引发了广泛讨论。支持者认为，仅依赖复杂UI而不提供可脚本化后端的产品，本质上是在阻挡AI的浪潮。他们指出，AI的水平已与人类相当，开发者需同时考虑人类和AI的需求，甚至只考虑AI。有人提出，文本交互不等于消灭UI，但UI应构建在“文本”之上，形成用户交互操作与文本之间的转换机制。反对者则认为，Karpathy提到的“高风险示例”如Photoshop、CAD等，是面向专业用户的，与普通软件不可同日而语。他们质疑，既然VSCode等文本交互形式的应用并非适合所有人，为何不能让AI适应人类的操作方式？

Karpathy还讨论了“验证差距”，指出研究人员需对AI生成内容有足够了解，才能判断其正确性。他借用GAN的工作过程，强调生成和判别在创造性工作中交替进行，判别在不同媒介中难度不同，图像最容易，文本更难，音频最难。Karpathy批评大模型编程中“重生成轻判别”的模式，认为大模型在生成阶段已压缩到即时，但在判别阶段几乎无改进，人仍需盯着结果判断其正确性。他指出，非专业人士对编程存在认知偏差，以为编程就是写代码，但实际上编程的本质是盯着代码看，类似大模型的判别过程。若仅加快“写”代码的速度，而不减少“思考代码”的负担，整体编程速度不会有明显提升。

Karpathy正在研发一种AI辅助编程工作流，其中一项关键工作是减少验证负担。他认同将文本视觉化是一种可行方式，但认为目前Cursor中的视觉形式非常糟糕，设想将整个代码库布局在二维画布上，让程序员通过各种“镜头”查看代码。这一设想引发了对未来应用形态的思考，未来的应用应如何更好地结合AI与人类需求，仍需进一步探索。