文心X1.1发布!这三大能力突出,一手实测在此

AIGC动态11小时前发布 QbitAI
75 0 0
文心X1.1发布!这三大能力突出,一手实测在此

 

文章摘要


【关 键 词】 文心X1.1深度学习飞桨升级模型开源百度AI

百度在WAVE SUMMIT深度学习开发者大会2025上带来多项新成果。升级后的文心大模型X1.1在事实性、指令遵循、智能体等能力上显著提升。官方展示其在智能客服场景复杂长程任务中的应用,能自动拆分任务、调用工具执行。与文心大模型X1相比,X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%,在官方评测基准上整体效果超越DeepSeek R1 – 0528,比肩GPT – 5、Gemini 2.5 Pro。

实测中,文心大模型X1.1表现出色。逻辑推理方面,成功解决“星球版”农夫过河变体题;事实性检验上,能纠正“郑和发现美洲”的错误说法;指令遵循能力也很强,完成小红书文案及封面图生成任务,还能调用联网搜索工具解释网络热梗。代码生成方面,设计的教资模拟试题HTML页面可在线作答、自动批阅打分,但分析聊天记录搞笑点时出现翻车情况。

文心大模型X1.1基于文心大模型4.5训练,采用迭代式混合强化学习训练框架,通过双重机制优化性能。还通过思维链 + 行动链多轮强化学习、指令验证器强化学习、知识一致性验证强化学习三大技术,精准提升智能体、指令遵循和事实性,形成“任务适配性 + 推理能力”的双重技术特征。

飞桨深度学习框架迎来v3.2版本升级,为文心X1.1及4.5系列模型提供“更稳、更快、更节能”的训练和推理支撑。训练端从计算、并行策略、容错能力三方面优化,推理端靠相关技术提供大模型高效部署及高性能推理全栈能力,硬件适配也更友好。

此外,百度进一步开源深度思考模型ERNIE – 4.5 – 21B – A3B – Thinking,还发布多个开发套件,提供“全栈工具链”支持。飞桨文心开发者数量超2333万,服务超76万家企业。百度通过扎实技术积累和开放策略,优化AI四层架构,降低AI开发与应用的创新门槛。

原文和模型


【原文链接】 阅读原文 [ 2683字 | 11分钟 ]
【原文作者】 量子位
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...