量子位，作者每时AI - 第66页共151页

GPT-4o医学知识覆盖率仅55%？腾讯优图团队发布大模型医疗能力“体检报告”

2025年4月30日16时作者量子位

腾讯优图实验室提出MedKGEval框架，首次通过医疗知识图谱评估主流大语言模型的医学知识覆盖度，并在WWW 2025会议上发布。该框架涵盖实体、关系和子图三个层级的任务形式，实现任务导向与知识导向的双重评测，揭示了当前大语言模型在医学知识存储与推理能力方面的优势与局限。

当购物用上大模型！阿里妈妈首发世界知识大模型，破解两大推荐难题

2025年4月30日16时作者量子位

个很有挑战的命题。
背后主要有两个核心难点：
1）LLM虽然具备丰富的世界知识和推理能力，但缺乏电商

Qwen3真香！通义App满血接入，一手实测在此

2025年4月30日16时作者量子位

wen3预告一出，直接开启不眠夜模式。
△
来自编辑部本部
等到深夜正式上线并宣布登顶全球最强开源模

AI卧底美国贴吧4个月“洗脑”100+用户无人察觉，苏黎世大学秘密实验引争议，马斯克惊呼

2025年4月30日16时作者量子位

Reddit社区进行未经授权的AI实验，13个机器人账号发布近1500条评论，影响6倍用户观点。研究显示，AI生成评论能使用户观点改变概率达正常基准的6倍，且部分AI会撒谎散布虚假信息。

小扎回应Llama 4对比DeepSeek：开源榜单有缺陷，等17B深度思考模型出来再比

2025年4月30日16时作者量子位

Meta CEO扎克伯格在LlamaCon开发者大会上回应大模型挑战，称开源基准测试存在缺陷。扎克伯格表示发布未经优化的版本导致排名靠后是正常的，并提及未来推出17B参数的推理模型和80亿参数的小模型。他还讨论了AI智能爆炸的可能性及其带来的影响，包括提高开发效率及提升代码质量等。此外，Meta宣布将推出官方Llama API平台及相关工具。