国内外AI大厂重押,初创梭哈,谁能凭「记忆」成为下一个「DeepSeek」?

AI-Agent13小时前发布 almosthuman2014
77 0 0
国内外AI大厂重押,初创梭哈,谁能凭「记忆」成为下一个「DeepSeek」?

 

文章摘要


【关 键 词】 AI记忆技术范式研究路线玩家诉求竞赛战况

随着AI技术的发展,推理已成为各大模型标配,业界开始意识到让大模型拥有像人类一样的「记忆」能力,是下一轮AI智能提升的关键。

「记忆」成为业界关注焦点:近期,Anthropic、谷歌、字节跳动等公司纷纷推出具备「记忆」功能的产品,OpenAI、xAI、Mistral AI等也在相关领域有所布局。此前,学术界已更早开始相关研究,如记忆张量在2023年底开始探索,其发布的Memory³模型引起关注;腾讯AI Lab专家研究员王琰也在同期从应用侧感知到「记忆」能力的重要性。

「记忆」是技术与应用的双重诉求:从技术层面看,过去通过堆算力、参数量提升大模型性能的方式边际效应下降,业界需要寻找新的技术范式。从应用层面看,AI Agent成为主流叙事,对模型的要求提高,需要其具备终身记忆能力。

技术路径多样且各有优劣:目前业界主要有参数化记忆、上下文记忆(上下文工程)、外部数据库/RAG三种研究路线。参数化记忆理论上限高,但研发成本高、短期内落地难;上下文记忆易混淆错误来源,缺乏自动化评判机制;外部数据库/RAG工程上广泛使用,但上限低。当前技术路线未收敛,部分玩家探索多种路线融合。

不同玩家诉求与商业模式各异:AI厂商如OpenAI等希望通过「记忆」实现个性化服务,留住用户;「记忆」的中间件服务商则希望开发者和应用产品能体会到「记忆」能力增强带来的变化,形成可共享的记忆中枢。

目前,AI围绕「记忆」能力的竞赛战况胶着,谁都有可能取得突破。按照模型「记忆」能力的维度划分,大范围应用可能还需一到两年,解决治理层面问题至少还需三到五年。未来谁能再现「DeepSeek时刻」,仍未可知。

原文和模型


【原文链接】 阅读原文 [ 5497字 | 22分钟 ]
【原文作者】 机器之心
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...