神医AI 要登场了?!
中国香港中文大学和深圳大数据研究院的研究团队带来重磅研究——HuatuoGPT-o1,一个能像医生一样思考的AI模型诞生了!
这不是普通的医疗模型升级,而是一次医疗AI领域的重大突破。这个名字取「华佗」,可不是浪得虚名。
要知道,虽然现在的大语言模型在数学推理上已经相当厉害了,但在医疗领域却显得「力不从心」。这是为什么呢?
AI也要像医生一样会「望闻问切」
医学和数学不一样,它没有标准答案。同样的症状可能是多种疾病引起的,需要医生仔细分析、反复推敲。这就好比你给模型出了道题,却不知道它的答案对不对,这可怎么教它学习?
研究团队使出了一招绝妙的法子:
先准备了4万个可验证的医疗问题,每个问题都有明确的标准答案。然后让GPT-4o来当「考官」,负责检查答案是否正确。
这就像是给AI配了个「华佗」老师,手把手教它看病!
两步训练,打造AI神医
第一步:教会它像医生一样思考。
用了四种神奇的招数:
-
回溯思考:重新审视已有的诊断过程
-
探索新路径:尝试不同的诊断思路
-
验证答案:核实诊断的准确性
-
及时纠错:发现问题立即调整
第二步:用强化学习让它不断进步。
每次诊断正确,就给它「奖励」,让它记住正确的思路。
实验证明,这种训练方法特别有效。模型平均每次回答能用712个词来解释它的推理过程,这种深度思考让它的诊断水平突飞猛进。
实力超群,横扫测试
这么训练出来的HuatuoGPT-o1到底有多厉害?
数据令人震撼:
-
8B参数的版本在医疗基准测试上提升了8.5个百分点
-
70B参数的版本更是横扫其他开源医疗大模型,在各种医疗测试中都拿下第一
-
验证准确率达到惊人水平:第一阶段96.5%,第二阶段94.5%
-
在中文医疗测试中,较其他中文模型提升近6个百分点
更厉害的是,它的推理过程非常「接地气」。它会像真正的医生一样,先列出症状特征,然后分析可能的病因,最后给出诊断建议。这种思维方式让它的诊断更准确、更可靠。
研究人员还发现,复杂推理对提升医疗问题解决能力特别有效。简单的回答往往不够准确,而经过深入思考的诊断则更接近专业医生的水平。
不过,它现在的角色是协助医生,而不是取代医生。毕竟,再厉害的AI也比不上经验丰富的医生的判断力和责任心。
论文地址:https://arxiv.org/abs/2412.18925
(文:AGI Hunt)