刚刚,微软CEO 宣布:AI 医生诊断准确率已达85.5%,是人类医生的4倍
微软CEO宣布其AI诊断系统MAI-DxO在NEJM的304个病例测试中准确率达到85.5%,远超经验丰富的医生20%的准确率,虚拟医生团队通过模拟真实诊疗过程展示了AI在医疗领域的潜力。
微软CEO宣布其AI诊断系统MAI-DxO在NEJM的304个病例测试中准确率达到85.5%,远超经验丰富的医生20%的准确率,虚拟医生团队通过模拟真实诊疗过程展示了AI在医疗领域的潜力。
Grok-4的基准测试数据在网上疯传,HLE成绩达到35%,使用推理后更是飙升到45%,相当于直接翻了一倍多,引发热议。
研究员们发现,一句关于猫咪有趣的事实能轻易让AI 出错。通过CatAttack方法测试后,DeepSeek V3的错误率提升了超过300%,表明推理模型在面对看似无关的信息时仍易受影响。
吴恩达分享了简化AI项目范围的方法,建议开发者从小规模组件开始,比如在一小时内完成的任务。他通过自己周末项目模拟观众来说明这一方法,强调在有限时间内先构建基本功能的重要性。
SSI创始团队分道扬镳,Ilya Sutskever宣布Daniel Gross离开公司并担任新CEO职务;SSI正寻求被收购,但坚持专注于”安全超级智能”理念。
生物学家Michael Levin提出肝脏等器官可能拥有独立意识的观点,并利用AI构建翻译器试图与其对话。他认为除了大脑,体内许多器官都符合判断「心智」的标准。通过AI作为桥梁,未来可能实现与身体各部位的对话,重新定义生命和自我认知。
Sam Altman在内部备忘录中批评Meta挖角OpenAI员工,称Meta的行为让人感觉有些令人不快,并强调了OpenAI的使命感和AGI愿景。对比Meta天价薪酬攻势,Altman表示OpenAI将凭借文化优势继续存在。
Claude Code 的斜杠命令迎重大升级,新增直接执行bash命令、引用文件作为上下文、通过关键词触发扩展思考模式等功能,并提供了内置命令大全、自定义命令、命名空间支持等特性,解锁高级特性的MCP服务集成也进一步增强用户体验。