智谱Agent抢跑OpenAI,GLM-PC一句话搞定一切!网友:有AGI那味了

AI-Agent8小时前发布 AIera
76 0 0
智谱Agent抢跑OpenAI,GLM-PC一句话搞定一切!网友:有AGI那味了

 

文章摘要


【关 键 词】 智能体多模态AI技术人机交互代码生成

智谱公司发布了全球首个面向公众、即用型的电脑智能体GLM-PC v1.1,该智能体具备“代码思维”,能够执行复杂任务,如识别图片信息生成文案并发送朋友圈。GLM-PC v1.1版本不仅能够观察和操作计算机,还具备深度思考模式,逻辑推理和代码生成功能。智谱的AI路线图将AGI实现划分为五级,目前AI能力已突破传统语言和文本处理限制,扩展到多模态和工具使用,未来将拥有更多自我认知能力。

智谱CEO张鹏提出,LLM已初步具备与现实物理世界互动的能力,智能体将提升L3使用工具能力,同时探索L4自我学习能力。GLM-PC v1.1的推出标志着智谱在L3级智能体探索的新进展,实现了工具使用能力的深度突破。智谱已有手机智能体AutoGLM和电脑智能体GLM-PC两大系统,分别覆盖移动设备和桌面端,实现对人机交互范式的根本性重塑。

GLM-PC通过多模态感知实现全GUI空间交互,拓宽了Agent在虚拟交互空间中的使用边界。智谱借鉴人类“左脑”与“右脑”分工,实现逻辑推理与感知认知的深度结合,赋予GLM-PC这种能力。GLM-PC的“左脑”负责逻辑推理、代码和任务执行,而“右脑”则是深度感知与交互体验的智能系统,涵盖GUI图像理解、用户行为认知等功能。

GLM-PC背后是智谱自主研发的多模态Agent模型CogAgent与代码模型CodeGeex。CogAgent-9B-20241220模型在多平台、多类别的GUI agent及GUI grounding benchmarks上取得了当前最优的结果,并已全面开源。智谱正与联想、华硕等PC厂商探讨深度合作,推动AIPC的创新与发展,使个人电脑能够完全理解用户意图,自动优化工作流程,提供精准的智能支持。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 3448字 | 14分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...