GPT-4o医学知识覆盖率仅55%?腾讯优图团队发布大模型医疗能力“体检报告”

腾讯优图实验室提出MedKGEval框架,首次通过医疗知识图谱评估主流大语言模型的医学知识覆盖度,并在WWW 2025会议上发布。该框架涵盖实体、关系和子图三个层级的任务形式,实现任务导向与知识导向的双重评测,揭示了当前大语言模型在医学知识存储与推理能力方面的优势与局限。