百川新模型超GPT-4o近20%,首创自约束训练方案突破瓶颈,主打「领域增强」

AIGC动态6小时前发布 QbitAI
27 0 0
百川新模型超GPT-4o近20%,首创自约束训练方案突破瓶颈,主打「领域增强」

 

文章摘要


【关 键 词】 金融大模型百川智能跨领域应用性能领先智能客服

全链路金融领域增强大模型Baichuan4-Finance在金融领域的表现超越了GPT-4o,成为新的金融领域大模型领导者。这一成就归功于百川智能的全链条领域增强方案,该方案不仅在金融领域取得成功,还具备跨领域应用的潜力,如医疗、教育和法律等。Baichuan4-Finance在金融类开/闭源benchmark上的表现尤为突出,其准确率和可用率均高于GPT-4o。

Baichuan4-Finance的成功得益于其全链路领域增强方案,包括高质量数据、自约束训练方案和微调阶段的大量增强工作。在开源金融benchmark FinanceIQ中,Baichuan4-Finance的整体准确率达到79.23%,领先GPT-4o约13%。在闭源金融benchmark FLAME中,Baichuan4-Finance在金融专业能力评测FLAME-Cer上的整体准确率为93.16%,超出GPT-4o近20%。在场景应用能力评测FLAME-Sce中,Baichuan4-Finance的整体可用率也是行业最高。

百川智能的训练方案包括训练数据准备、模型post-pretrain和模型微调三个阶段。在训练数据准备阶段,百川构建了全面、严谨、高质量的金融领域训练数据体系,并采用了智能数据去噪技术、高效数据去重机制、严格数据脱敏等数据处理手段。在模型post-pretrain阶段,百川提出了领域自约束的训练方案,通过构建一个和基础模型同参且参数不更新的“reference model”来指导模型训练,保证通用能力不下降,领域能力提升。在模型微调阶段,百川采用了有监督微调和强化学习策略,优化模型在特定金融任务上的表现。

Baichuan4-Finance的应用案例包括商业银行信用卡中心和保险公司,通过智能客服解决方案和智能营销辅助系统,显著提升了运营效率、风控合规、客户服务和决策支持等方面的价值。百川智能的技术策略和首创方案的实用价值,预示着大模型的能力将在更多行业和领域内产生深刻长远的影响。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 4412字 | 18分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...