AI现场发了2万红包,打开了大模型Act时代
文章摘要
【关 键 词】 AI智能体、人机交互、智能调度、大模型OS、跨平台操作
近期,AI智能体领域迎来了革命性的发展。Anthropic推出的Claude 3.5 Sonnet能够直接操纵电子设备,执行自然语音指令,模拟人类与计算机的交互。国内公司智谱Agent也宣布升级,开放“百万内测”申请,标志着人机交互体验的新篇章。智谱Agent能够通过语音直接操纵硬件设备,跨不同App全局操作,覆盖手机、PC和AI原生硬件。
智谱智能体的手机版AutoGLM和电脑版GLM-PC在内测阶段覆盖了常用的App及应用。AutoGLM支持社交平台、美食平台、购物平台、出行平台和旅游订票平台等,用户只需动动嘴或文字输入,就能让智能体接管手机并自动执行指令任务。智谱对AutoGLM进行了能力升级,包括理解、遵循并自主完成超长、复杂的指令,支持超过50步的无打断连贯操作;支持复杂任务的跨App操作,实现App之间的协同操作;以及一键存储用户自定义的快捷短口令,自动发起并执行关联长任务。
智谱还在浏览器的智谱清言插件上提供了AutoGLM-Web功能,适配了社媒网站、搜索引擎、学术网站、代码托管网站和资讯类网站。智能体遵循用户指令,可以自动执行站内搜索、内容总结、生成日报、搭建仓库、签到等个性化功能。桌面端的GLM-PC基于通用视觉大模型CogAgent的理解与任务规划能力,让用户通过简单的一句话指令执行复杂任务。
智谱还实现了GLM-PC与手机端的联动,用户可以在手机上远程向GLM-PC发消息,让它自动进行电脑端操作。智谱计划对十个亿级App进行免费Auto升级,并与芯片、终端厂商合作,从硬件底层进行优化,持续优化端侧大模型的能力。
智谱CEO张鹏表示,目前的Agent能力更像是在用户和应用、设备之间增加一个智能的调度层,可以看做是大模型通用操作系统LLM-OS的一种雏形,这已经对人机交互形式产生极大的影响。更重要的是,我们看到了一种大模型操作系统LLM-OS的可能,基于大模型智能能力,有机会实现原生的人机交互。
原文和模型
【原文链接】 阅读原文 [ 3359字 | 14分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★