AI现场发了2万红包，打开了大模型Act时代

AI-Agent10个月前发布 almosthuman2014

1,899 0 0

文章摘要

近期，AI智能体领域迎来了革命性的发展。Anthropic推出的Claude 3.5 Sonnet能够直接操纵电子设备，执行自然语音指令，模拟人类与计算机的交互。国内公司智谱Agent也宣布升级，开放“百万内测”申请，标志着人机交互体验的新篇章。智谱Agent能够通过语音直接操纵硬件设备，跨不同App全局操作，覆盖手机、PC和AI原生硬件。

智谱智能体的手机版AutoGLM和电脑版GLM-PC在内测阶段覆盖了常用的App及应用。AutoGLM支持社交平台、美食平台、购物平台、出行平台和旅游订票平台等，用户只需动动嘴或文字输入，就能让智能体接管手机并自动执行指令任务。智谱对AutoGLM进行了能力升级，包括理解、遵循并自主完成超长、复杂的指令，支持超过50步的无打断连贯操作；支持复杂任务的跨App操作，实现App之间的协同操作；以及一键存储用户自定义的快捷短口令，自动发起并执行关联长任务。

智谱还在浏览器的智谱清言插件上提供了AutoGLM-Web功能，适配了社媒网站、搜索引擎、学术网站、代码托管网站和资讯类网站。智能体遵循用户指令，可以自动执行站内搜索、内容总结、生成日报、搭建仓库、签到等个性化功能。桌面端的GLM-PC基于通用视觉大模型CogAgent的理解与任务规划能力，让用户通过简单的一句话指令执行复杂任务。

智谱还实现了GLM-PC与手机端的联动，用户可以在手机上远程向GLM-PC发消息，让它自动进行电脑端操作。智谱计划对十个亿级App进行免费Auto升级，并与芯片、终端厂商合作，从硬件底层进行优化，持续优化端侧大模型的能力。

智谱CEO张鹏表示，目前的Agent能力更像是在用户和应用、设备之间增加一个智能的调度层，可以看做是大模型通用操作系统LLM-OS的一种雏形，这已经对人机交互形式产生极大的影响。更重要的是，我们看到了一种大模型操作系统LLM-OS的可能，基于大模型智能能力，有机会实现原生的人机交互。