微软医疗论文泄密:GPT-4o 200B 「大未必强」,Claude 175B 「小未必弱」
微软在最新发布的医疗 AI 评测论文中披露了多个头部 AI 模型的关键参数数据,引发关注。包括 MEDEC 在内的研究团队开发的 MEDEC 评测基准用于检验 AI 模型识别和纠正医疗文档错误的能力,列出了一系列令人瞠目的数据,引发了对 AI 领域技术路线、大模型架构与实际应用效果等议题的讨论。
微软在最新发布的医疗 AI 评测论文中披露了多个头部 AI 模型的关键参数数据,引发关注。包括 MEDEC 在内的研究团队开发的 MEDEC 评测基准用于检验 AI 模型识别和纠正医疗文档错误的能力,列出了一系列令人瞠目的数据,引发了对 AI 领域技术路线、大模型架构与实际应用效果等议题的讨论。
微软发布一篇论文提及GPT-4系列模型参数,并指出Claude 3.5 Sonnet优于其他LLM方法。论文还介绍了MEDEC研究项目,该项目旨在识别临床笔记中的错误并改正。
微软在MEDEC研究中意外公布了其部分主要闭源大型语言模型的参数规模,包括Claude 3.5 Sonnet (175B),GPT-4 (~1.76T),Claude 3.5 Claude 3.5 (8B)和o1-preview (~300B)。
OpenAI公布了2025年的目标,AGI排在首位。他们表示AGI的定义是能够带来1000亿美元收益的AI系统。新年目标还包括改进记忆力、延长成熟模式等功能。
中国AI创业者背景多元,涵盖名校大厂和各领域专家。北京、广东、上海是主要聚集地,AIGC/大模型、自动驾驶、人形机器人等赛道涌现独角兽企业。面对技术、市场和资金挑战,创业者需积极应对策略。
2024年ISIG产业智能大会召开,聚焦AI大模型、RPA等技术应用。多位专家分享了在金融、医疗、教育等领域的创新实践与挑战。会议强调持续关注AI的社会影响,并期待产学研界共同推动技术发展。