
文章摘要
在人与AI高度协同的时代,Karpathy预言,仅依赖复杂UI界面的应用程序将面临淘汰,特别是Adobe和CAD等软件。他提出,复杂的UI界面无法与大模型形成有效的人机协同,无法满足准专业用户的“氛围式编程”需求。Karpathy根据UI和文本含量的不同,将常见应用划分为四个“风险等级”,并强调,尽管AI在UI操作上会进步,但开发者若停滞不前,仍无法取得好的发展。
Karpathy的观点引发了广泛讨论。支持者认为,仅依赖复杂UI而不提供可脚本化后端的产品,本质上是在阻挡AI的浪潮。他们指出,AI的水平已与人类相当,开发者需同时考虑人类和AI的需求,甚至只考虑AI。有人提出,文本交互不等于消灭UI,但UI应构建在“文本”之上,形成用户交互操作与文本之间的转换机制。反对者则认为,Karpathy提到的“高风险示例”如Photoshop、CAD等,是面向专业用户的,与普通软件不可同日而语。他们质疑,既然VSCode等文本交互形式的应用并非适合所有人,为何不能让AI适应人类的操作方式?
Karpathy还讨论了“验证差距”,指出研究人员需对AI生成内容有足够了解,才能判断其正确性。他借用GAN的工作过程,强调生成和判别在创造性工作中交替进行,判别在不同媒介中难度不同,图像最容易,文本更难,音频最难。Karpathy批评大模型编程中“重生成轻判别”的模式,认为大模型在生成阶段已压缩到即时,但在判别阶段几乎无改进,人仍需盯着结果判断其正确性。他指出,非专业人士对编程存在认知偏差,以为编程就是写代码,但实际上编程的本质是盯着代码看,类似大模型的判别过程。若仅加快“写”代码的速度,而不减少“思考代码”的负担,整体编程速度不会有明显提升。
Karpathy正在研发一种AI辅助编程工作流,其中一项关键工作是减少验证负担。他认同将文本视觉化是一种可行方式,但认为目前Cursor中的视觉形式非常糟糕,设想将整个代码库布局在二维画布上,让程序员通过各种“镜头”查看代码。这一设想引发了对未来应用形态的思考,未来的应用应如何更好地结合AI与人类需求,仍需进一步探索。
原文和模型
【原文链接】 阅读原文 [ 1241字 | 5分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek-v3
【摘要评分】 ★★☆☆☆