文心X1.1发布！这三大能力突出，一手实测在此

75 0 0

文章摘要

百度在WAVE SUMMIT深度学习开发者大会2025上带来多项新成果。升级后的文心大模型X1.1在事实性、指令遵循、智能体等能力上显著提升。官方展示其在智能客服场景复杂长程任务中的应用，能自动拆分任务、调用工具执行。与文心大模型X1相比，X1.1的事实性提升34.8%，指令遵循提升12.5%，智能体提升9.6%，在官方评测基准上整体效果超越DeepSeek R1 – 0528，比肩GPT – 5、Gemini 2.5 Pro。

实测中，文心大模型X1.1表现出色。逻辑推理方面，成功解决“星球版”农夫过河变体题；事实性检验上，能纠正“郑和发现美洲”的错误说法；指令遵循能力也很强，完成小红书文案及封面图生成任务，还能调用联网搜索工具解释网络热梗。代码生成方面，设计的教资模拟试题HTML页面可在线作答、自动批阅打分，但分析聊天记录搞笑点时出现翻车情况。

文心大模型X1.1基于文心大模型4.5训练，采用迭代式混合强化学习训练框架，通过双重机制优化性能。还通过思维链 + 行动链多轮强化学习、指令验证器强化学习、知识一致性验证强化学习三大技术，精准提升智能体、指令遵循和事实性，形成“任务适配性 + 推理能力”的双重技术特征。

飞桨深度学习框架迎来v3.2版本升级，为文心X1.1及4.5系列模型提供“更稳、更快、更节能”的训练和推理支撑。训练端从计算、并行策略、容错能力三方面优化，推理端靠相关技术提供大模型高效部署及高性能推理全栈能力，硬件适配也更友好。

此外，百度进一步开源深度思考模型ERNIE – 4.5 – 21B – A3B – Thinking，还发布多个开发套件，提供“全栈工具链”支持。飞桨文心开发者数量超2333万，服务超76万家企业。百度通过扎实技术积累和开放策略，优化AI四层架构，降低AI开发与应用的创新门槛。