AI-Agent

AI Agent,Agent

400 tokens/秒!阶跃Step 3.7 Flash,把Agent任务成本打到Claude零头

阶跃星辰正式发布了Step 3.7 Flash多模态大模型,旨在解决人工智能代理在规模化应用中面临的高成本与高延迟问题。该模型以极高的生成速度和仅需竞品九分之一...

把 GPT-4o 拉下神坛!星源智联合北大推出 RoboAgent,让 3B VLM 在未知场景跑出 94% 成功率

当前视觉语言模型在处理真实环境中的具身任务时,常常面临多轮交互、长程推理以及奖励信号稀疏等实操困境。为解决这一难题,北京大学与星源智团队共同提出了...

昇腾管推理、鲲鹏管 Agent,Agentic AI 让 CPU 重回舞台中央

DeepSeek-V4模型首发适配昇腾芯片,标志着中国大模型产业正从高度依赖海外生态,逐步走向由国产芯片、基础软件与系统架构共同支撑的新阶段。中国大模型能力正...

5亿Tokens白送!全球首个商用AI主机发布,终于能放开烧Token了

随着AI Agent在业务中的深入应用,按Token计费的模式导致企业成本线性增长,缺乏规模效应,同时核心数据上云也带来安全隐患。对于一人公司和成长型企业而言,...

阶跃发布 Step 3.7 Flash,效率模型开始争夺 Agent 主战场

在人工智能向智能体时代演进的过程中,Flash模型的定位正发生深刻转变,从旗舰模型的轻量版本转变为智能体时代的任务基座。在真实的智能体工作流中,速度、智...

硅谷大事件丨Anthropic 以9650亿美元估值登顶王座;Claude Opus 4.8发布,主打「知错就认」;苹果憋大招,欲将Gemini蒸馏塞入iPhone

近期人工智能领域在资本市场、模型技术以及基础设施布局方面呈现出显著的发展态势。在资本与市场表现方面,Anthropic完成650亿美元融资,投后估值达到9650亿...

GUI Agent轨迹获取新范式:有限状态机合成无限轨迹数据,平均每条轨迹成本低至0.04美元

针对训练图形用户界面智能体时真实网页内部状态不可见导致轨迹验证困难的问题,研究团队提出了一种由有限状态机驱动的网页环境生成框架AutoWebWorld。该框架...

四道题评测 Qwen3.7-Max:从空间推理到 3D 建模,它离 Agent 更近了吗?

阿里云通义千问团队在三个月内连续发布三款旗舰大模型,最新推出的Qwen3.7-Max在多项权威评测中表现卓越,位列全球第五、国产第一。该模型在推理和编程智能体...

Agent 该怎么做真正的安全评测?

上海人工智能实验室等机构提出了一系列面向智能体安全评测与诊断的基准测试,包括ATBench及其扩展版本ATBench-Claw和ATBench-CodeX。这些研究将智能体安全评...

小龙虾彻底凉了?清华团队连夜开源Agent神器,Token成本狂降70%!

清华大学联合面壁智能等团队研发并开源了名为PilotDeck的智能体操作系统,旨在解决当前Agent工具在生产力应用中面临的工程化痛点。该系统通过提供独立工作舱...
1 2 3 174