医疗复杂推理开源大模型——华佗GPT-o1

AIGC动态18小时前发布 AIGCOPEN
55 0 0
医疗复杂推理开源大模型——华佗GPT-o1

 

文章摘要


【关 键 词】 医疗辅助大模型推理优化数据集性能测试

香港中文大学(深圳)和深圳市大数据研究院联合开源了一款专用于医疗领域的复杂大模型——华佗GPT-o1,旨在辅助医生进行更高效的推理。该模型的开发基于高质量医学数据集,研究人员从MedQA-USMLE和MedMCQA训练集中收集了192K医学多项选择题,并通过多轮筛选方法,最终得到一个包含40K可验证医学问题的数据集。

华佗GPT-o1采用两阶段训练模式。第一阶段,模型对给定的可验证医学问题进行初步分析,生成初始的思维链(CoT)和答案。第二阶段,医学验证器对初始答案进行验证,若答案不正确,模型将启动迭代优化过程,从四种搜索策略中随机选择一种进行改进。模型会不断重复这个过程,直到找到正确的答案。

在成功找到正确的推理轨迹后,模型会将轨迹重新格式化为一种更加自然、连贯的复杂CoT形式,突出关键的推理步骤和依据。然后,模型根据这个复杂CoT生成一个正式的回答,包含最终的结论和推理过程的简要总结。

为了评估华佗GPT-o1的性能,研究人员在MedQA、MMLU-Pro、MedMCQA、PubMedQA等医学基准中进行了综合测试。结果显示,华佗GPT-o1-70B版本在多个数据集上超越了其他所有开源模型,取得了领先成绩。例如,在MMLU-Pro的健康和生物学赛道上,其准确率分别达到了73.6%和71.0%,在GPQA的遗传学和分子生物学赛道上,准确率也分别达到了66.5%和56.2%。这表明华佗GPT-o1在医学领域的推理能力具有显著优势。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 1553字 | 7分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...