首页 » Med-PaLM 2:Google研究的专家级医疗大语言模型

Med-PaLM 2:Google研究的专家级医疗大语言模型

by AIBackup

Med-PaLM 2是Google研究开发的一款大语言模型(LLM),专门为医疗领域设计。这款模型的目标是为医疗问题提供高质量的答案。Med-PaLM 2利用了Google大语言模型的强大能力,并通过一系列精心策划的医疗专家演示将其对齐到医疗领域。

Med-PaLM 2在美国医疗执照考试(USMLE)样题上的表现达到了“专家”级别,这是人工智能系统首次在此类考试上达到通过标准。此外,Med-PaLM 2还能为消费者健康问题生成准确、有用的长篇答案,这些答案经过医生和用户的评估。

Med-PaLM 2的训练过程涉及到美国、英国和印度的一组临床医生。研究人员从这组临床医生那里获取了一组代表性的答案,然后调整模型以产生更像这些答案的答案。然后,他们利用这组临床医生和他们的判断来评估这些模型是否在一系列人类价值观(包括低可能的医疗伤害、科学共识的一致性、精确性和无偏见)上表现得更好。

Med-PaLM 2不仅能理解和解答文本问题,还能处理和理解医疗影像等多模态医疗信息。这一点对于医生来说非常重要,因为医疗实践本质上是多模态的,需要从图像、电子健康记录、传感器、可穿戴设备、基因组等多种数据中获取信息。研究人员相信,能够在大规模使用这些数据的AI系统,将是下一代学习健康系统的基础,这将使世界级的医疗保健能力扩展到每个人。

然而,尽管Med-PaLM 2在多个选择性医疗问题回答基准测试上达到了最先进的性能,但我们知道,要确保其安全有效地部署,还需要做更多的工作。例如,使用LLM诊断或治疗疾病的潜在危害,远大于使用LLM获取关于疾病或药物的信息。需要进行额外的研究,以评估在医疗保健中使用LLM的均质化和偏见放大以及从基础模型继承的安全漏洞。

在未来,Google研究将继续推进对Med-PaLM 2的研究,改进模型,同时评估Med-PaLM 2在安全性、偏见和有用性等多个方面的表现。在未来的几个月里,Med-PaLM 2将被提供给一小部分Google Cloud客户进行有限的测试,以探索使用案例并分享反馈,同时谷歌正在研究使用这项技术的安全、负责任和有意义的方式。

相关资料:

也许你还会喜欢