谷歌最新发布Med-Gemini多模态医学大模型，科研与临床诊疗落地的鸿沟

AIGC动态1年前 (2024)更新 admin

2,281 0 0

文章摘要

Med-Gemini是基于Gemini 1.0和1.5模型的进一步发展，它在10项基准测试中取得了最先进的性能。研究人员使用了自我训练与网络搜索集成、多模态微调和定制编码器等技术，使得Med-Gemini在医学领域的应用更为精准和高效。在MedQA基准测试中，Med-Gemini的表现超过了GPT-4等其他模型。

Med-Gemini的多模态能力使其能够处理和分析包括文本、图像、视频以及原始传感器输入如心电图（ECG）在内的各种医学数据。它还能在多模式医学对话中请求额外信息，并为其推理提供解释，这突显了AI在医疗领域中支持医疗提供者和患者之间更自然、更全面交互的潜力。

尽管Med-Gemini的性能令人印象深刻，但也有批评声音指出，该模型依赖于传统的数据基准，而这些基准可能无法完全反映真实世界的复杂性。例如，MedQA基准测试采用的是多项选择、类似考试的评估方式，这可能与复杂的临床环境中的应用场景有所不同。此外，有研究表明，即使是在医学基准测试上表现良好的模型，在“临床医生对齐”的基准上可能表现不佳，这表明追逐基准而非真正的使用案例可能会带来后果。

总的来说，Med-Gemini模型在医学领域的多模态任务中展示了强大的性能和潜力，但在将其应用于真实世界的医疗环境之前，还需要进行更多的验证和评估。Google在医疗领域的AI发展方面处于先导地位，但同时也需要注意到，理论上的准确性并不总是等同于实际应用中的有效性。