智谱在Agent OpenDay上秀了把肌肉,顺便招了个商

AI-Agent14小时前发布 Si-Planet
21 0 0
智谱在Agent OpenDay上秀了把肌肉,顺便招了个商

 

文章摘要


【关 键 词】 AI Agent智能助手多平台屏幕共享合作生态

智谱AI在Agent OpenDay上展示了其在AI Agent领域的最新成果,包括AutoGLM、AutoGLM-Web和GLM-PC三款产品,分别针对手机、浏览器和电脑平台。AutoGLM作为智谱GLM的第一个产品化Agent,能够接受文字和语音指令,模拟人类操作手机完成如点外卖、订酒店等任务。升级后的AutoGLM支持更多步操作任务和跨App执行任务的能力,已支持微信、抖音等多个社交平台和购物平台。AutoGLM的核心场景和应用的标品API即将上线智谱maas开放平台试用。

AutoGLM-Web作为浏览器插件,模拟用户浏览操作,自动完成网页浏览、信息检索等任务,目前已适配多个社媒网站和搜索引擎。GLM-PC则是一款帮助用户操作计算机的软件,用户输入指令后,GLM-PC能理解并规划任务,自动操作电脑。GLM-PC支持手机远程控制和定时功能,目前已开启内测。

智谱研发的“隐形屏幕”技术旨在解决智能体与用户争夺屏幕和输入设备资源的问题,允许用户在AI执行任务的同时继续使用电脑。相关模型技术报告和隐形屏幕将在明年第一季度推出。

AutoGLM基于ChatGLM模型系列构建,通过安卓无障碍服务获取屏幕信息,分析、规划任务,实现对手机常用操作的模拟执行。智谱在Agent训练中引入了inference compute scaling概念,实验显示增加训练时的计算规模可以提升Agent的表现。GLM-PC的底层模型是CogAgent,一个通用的视觉-操作模型,模拟人类的视觉感知来从环境中获取唯一的输入,以语言作为推理和决策的媒介。

智谱的三款产品均处于探索阶段,支持的应用种类和操作的准确率有待提升,但其理论上可适用于任何带有图形用户界面的计算设备,带来巨大的想象空间。智谱CEO张鹏表示,智谱的探索意义高于实际应用意义,但也意味着更高的上限。智谱在发布会上向行业伙伴发出开放合作的邀约,与荣耀、华硕、小鹏汽车等终端厂商以及高通、英特尔等芯片巨头介绍了深度合作计划,体现了智谱在AI生态构建中的关键地位。智谱的定位保持与第三方厂商生态的兼容性,通过构建开放、互利的合作模式,寻找增量,无意争抢。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 3495字 | 14分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...