百川新模型超GPT-4o近20%，首创自约束训练方案突破瓶颈，主打「领域增强」

1,345 0 0

文章摘要

全链路金融领域增强大模型Baichuan4-Finance在金融领域的表现超越了GPT-4o，成为新的金融领域大模型领导者。这一成就归功于百川智能的全链条领域增强方案，该方案不仅在金融领域取得成功，还具备跨领域应用的潜力，如医疗、教育和法律等。Baichuan4-Finance在金融类开/闭源benchmark上的表现尤为突出，其准确率和可用率均高于GPT-4o。

Baichuan4-Finance的成功得益于其全链路领域增强方案，包括高质量数据、自约束训练方案和微调阶段的大量增强工作。在开源金融benchmark FinanceIQ中，Baichuan4-Finance的整体准确率达到79.23%，领先GPT-4o约13%。在闭源金融benchmark FLAME中，Baichuan4-Finance在金融专业能力评测FLAME-Cer上的整体准确率为93.16%，超出GPT-4o近20%。在场景应用能力评测FLAME-Sce中，Baichuan4-Finance的整体可用率也是行业最高。

百川智能的训练方案包括训练数据准备、模型post-pretrain和模型微调三个阶段。在训练数据准备阶段，百川构建了全面、严谨、高质量的金融领域训练数据体系，并采用了智能数据去噪技术、高效数据去重机制、严格数据脱敏等数据处理手段。在模型post-pretrain阶段，百川提出了领域自约束的训练方案，通过构建一个和基础模型同参且参数不更新的“reference model”来指导模型训练，保证通用能力不下降，领域能力提升。在模型微调阶段，百川采用了有监督微调和强化学习策略，优化模型在特定金融任务上的表现。

Baichuan4-Finance的应用案例包括商业银行信用卡中心和保险公司，通过智能客服解决方案和智能营销辅助系统，显著提升了运营效率、风控合规、客户服务和决策支持等方面的价值。百川智能的技术策略和首创方案的实用价值，预示着大模型的能力将在更多行业和领域内产生深刻长远的影响。