百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4

AIGC动态11个月前更新 ai-front
1,462 0 0

作者信息


【原文作者】 AI前线
【作者简介】 面向AI爱好者、开发者和科学家,提供AI领域技术资讯、一线业界实践案例、搜罗整理业界技术分享干货、AI论文解读。每周一节技术分享公开课,助力你全面拥抱人工智能技术。
【微 信 号】 ai-front

百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4

文章摘要


【关 键 词】 百川智能Baichuan 3超千亿参数技术创新中文任务

百川智能最近发布了一个超千亿参数的大型语言模型Baichuan 3,该模型在多个通用能力评测中表现出色,尤其在中文任务上超越了GPT-4

Baichuan 3在数学、代码生成、医疗评测等专项任务中也展现了强大的实力。百川智能为了提升模型的训练效率和稳定性,采用了多种创新技术,如动态数据选择重要度保持异步CheckPoint存储等。

在医疗领域,Baichuan 3通过构建超过千亿Token的医疗数据集,并通过调优Prompt,显著提升了医疗任务的效果。

此外,Baichuan 3还突破了迭代式强化学习技术,在诗词创作等领域的表现优异。

百川智能的这些技术创新和模型的强大表现,为将大模型技术应用于更多复杂场景提供了有力支撑。

原文信息


【原文链接】 阅读原文
【原文字数】 2673
【阅读时长】 9分钟

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...