AI 神医面世,华佗GPT 来了!

神医AI 要登场了?!

中国香港中文大学和深圳大数据研究院的研究团队带来重磅研究——HuatuoGPT-o1,一个能像医生一样思考的AI模型诞生了!

这不是普通的医疗模型升级,而是一次医疗AI领域的重大突破。这个名字取「华佗」,可不是浪得虚名。

要知道,虽然现在的大语言模型在数学推理上已经相当厉害了,但在医疗领域却显得「力不从心」。这是为什么呢?

AI也要像医生一样会「望闻问切」

医学和数学不一样,它没有标准答案。同样的症状可能是多种疾病引起的,需要医生仔细分析、反复推敲。这就好比你给模型出了道题,却不知道它的答案对不对,这可怎么教它学习?

研究团队使出了一招绝妙的法子:

先准备了4万个可验证的医疗问题,每个问题都有明确的标准答案。然后让GPT-4o来当「考官」,负责检查答案是否正确。

这就像是给AI配了个「华佗」老师,手把手教它看病!

两步训练,打造AI神医

第一步:教会它像医生一样思考。

用了四种神奇的招数:

  • 回溯思考:重新审视已有的诊断过程

  • 探索新路径:尝试不同的诊断思路

  • 验证答案:核实诊断的准确性

  • 及时纠错:发现问题立即调整

第二步:用强化学习让它不断进步。

每次诊断正确,就给它「奖励」,让它记住正确的思路。

实验证明,这种训练方法特别有效。模型平均每次回答能用712个词来解释它的推理过程,这种深度思考让它的诊断水平突飞猛进。

实力超群,横扫测试

这么训练出来的HuatuoGPT-o1到底有多厉害?

数据令人震撼:

  • 8B参数的版本在医疗基准测试上提升了8.5个百分点

  • 70B参数的版本更是横扫其他开源医疗大模型,在各种医疗测试中都拿下第一

  • 验证准确率达到惊人水平:第一阶段96.5%,第二阶段94.5%

  • 在中文医疗测试中,较其他中文模型提升近6个百分点

更厉害的是,它的推理过程非常「接地气」。它会像真正的医生一样,先列出症状特征,然后分析可能的病因,最后给出诊断建议。这种思维方式让它的诊断更准确、更可靠。

研究人员还发现,复杂推理对提升医疗问题解决能力特别有效。简单的回答往往不够准确,而经过深入思考的诊断则更接近专业医生的水平。

不过,它现在的角色是协助医生,而不是取代医生。毕竟,再厉害的AI也比不上经验丰富的医生的判断力和责任心。

论文地址:https://arxiv.org/abs/2412.18925

(文:AGI Hunt)

发表评论