百川发布超千亿大模型 Baichuan 3:多项中文任务评测超 GPT-4、中文医疗任务最佳大模型

AIGC动态11个月前发布 Founder Park
1,529 0 0

作者信息


【原文作者】 Founder Park
【作者简介】 来自极客公园,专注与科技创业者聊「真问题」。
【微 信 号】 Founder-Park

百川发布超千亿大模型 Baichuan 3:多项中文任务评测超 GPT-4、中文医疗任务最佳大模型
 

文章摘要


【关 键 词】 百川智能Baichuan 3超千亿参数医疗能力迭代式强化

百川智能发布了其超千亿参数的大模型Baichuan 3,该模型在多个通用能力测试中表现出色,特别是在中文任务上超越了GPT-4。Baichuan 3在医疗领域的权威评测中也显示出了卓越的中文效果,超过了GPT-4,成为中文医疗任务中表现最佳的大模型。此外,Baichuan 3采用了迭代式强化学习技术,进一步提升了语义理解和生成能力,在诗词创作等方面的表现也优于其他大模型。

在基础能力方面,Baichuan 3在英文评测中接近GPT-4水平,在多个中文评测中超越GPT-4,显示出其在中文任务上的优势。百川智能为了解决超千亿参数模型在训练过程中的挑战,提出了多种创新技术,如动态数据选择、重要度保持和异步CheckPoint存储等,有效提升了模型的各项能力。

在医疗数据集方面,Baichuan 3构建了超过千亿Token的医疗数据集,涵盖了广泛的医学知识。模型在医疗领域的全能特性,如多模态学习、深层推理、稳定性能和知识更新能力等,都得到了充分的发挥。Baichuan 3在医疗领域的任务效果显著提升,在多个中英文医疗测试中的成绩提升了2到14个百分点。

在技术突破方面,百川智能通过迭代式强化学习技术,大幅提升了Baichuan 3的语义理解和生成创作能力。特别是在诗词创作方面,Baichuan 3的表现远超GPT-4,能够创作出格式、韵律、表意都优秀的作品。

总的来说,Baichuan 3的发布标志着百川智能在大模型领域的一个新里程碑,其在通用中文任务和医疗领域的强大表现,将为百川智能在各种复杂应用场景中落地大模型技术提供有力支撑。

原文信息


【原文链接】 阅读原文
【原文字数】 3254
【阅读时长】 11分钟

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...