打造全球首个强化学习云平台,九章云极是如何做到的?

打造全球首个强化学习云平台,九章云极是如何做到的?

 

文章摘要


【关 键 词】 AI智能体强化学习云计算九章云极范式转变

人工智能领域正经历从被动响应的语言模型向具备自主决策能力的智能体模型的深刻转变,强化学习(RL)重新成为实现「感知-决策-行动」闭环的关键技术。诺贝尔奖得主Demis Hassabis和强化学习之父Richard Sutton均强调,强化学习是智能体实现超人能力的基础。然而,传统云计算平台难以满足强化学习对动态资源调度和高频交互的需求,这成为制约其规模化应用的瓶颈。

2025年6月,九章云极发布的工业级强化学习云平台AgentiCTRL突破了这一限制。该平台基于混合专家(MoE)架构,是全球首个支持万卡级异构算力调度的强化学习基础设施。其核心创新体现在三方面:首先,通过深度封装训练流程,将传统需数十行脚本的配置简化为极简代码操作;其次,首创Serverless架构与RL工作负载的深度融合,实现算力弹性伸缩;最后,自研的异构算力操作系统解决了多节点通信和同步难题。实际测试中,AgentiCTRL使训练效率提升500%,成本下降60%,在Computer Use任务中,其训练的Alaya-UI智能体任务完成率从基础模型的6.87%跃升至24.8%。

九章云极的战略远不止于单一平台,而是构建了完整的智能基础设施体系。其「三层架构」包括底层的异构算力调度系统、中层的Alaya NeW OS操作系统,以及上层的工具链生态。这种设计将强化学习从科研工具转化为操作系统级能力,通过1度算力标准和Serverless计价模式,显著降低使用门槛。目前该体系已在政务、金融等七大行业落地,GPU利用率超95%,总拥有成本降低60%。

九章云极通过「AI-STAR生态联盟」和1.8亿元专项基金,加速智能体技术在产业端的渗透。这种从底层架构到产业生态的全链路重构,标志着AI云服务从资源供给向智能体原生平台的范式跃迁。当智能体成为AI主流形态时,AgentiCTRL代表的系统性创新或将成为行业分水岭——它不仅重新定义了强化学习的工程化标准,更提前锁定了下一代AI基础设施的竞争制高点。

原文和模型


【原文链接】 阅读原文 [ 3328字 | 14分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...