谢赛宁摊上事了!被曝论文藏「只给好评」提示词操纵AI 审稿
NYU教授Saining Xie在自己的论文中藏了引导AI给出好评的提示词,引发学术界争议。事件揭示了AI时代学术评审的新挑战及诚信边界问题。
NYU教授Saining Xie在自己的论文中藏了引导AI给出好评的提示词,引发学术界争议。事件揭示了AI时代学术评审的新挑战及诚信边界问题。
Google旗下Isomorphic Labs公司宣布其AI设计的抗癌药物将进入人体临床试验,该公司从DeepMind分拆出来,利用AlphaFold技术加速药物发现过程,目标是提高成功率并降低研发成本。
Claude Code在短短四个月内吸引了11.5万开发者,改写了约1.95亿行代码,并可能带来年收入1.3亿美元。尽管存在价格调整问题,Cursor正面临困境,而Claude Code因其出色的初级工程师能力受到开发者欢迎。
Andrej Karpathy提出代码设计应像细菌基因组一样,小巧精悍、模块化且自给自足,并强调通过‘水平基因转移’促进社区发展。他引用了细菌的生存策略来比喻编码风格,认为这能帮助构建繁荣的开源社区。
微软CEO宣布其AI诊断系统MAI-DxO在NEJM的304个病例测试中准确率达到85.5%,远超经验丰富的医生20%的准确率,虚拟医生团队通过模拟真实诊疗过程展示了AI在医疗领域的潜力。
Grok-4的基准测试数据在网上疯传,HLE成绩达到35%,使用推理后更是飙升到45%,相当于直接翻了一倍多,引发热议。
研究员们发现,一句关于猫咪有趣的事实能轻易让AI 出错。通过CatAttack方法测试后,DeepSeek V3的错误率提升了超过300%,表明推理模型在面对看似无关的信息时仍易受影响。
吴恩达分享了简化AI项目范围的方法,建议开发者从小规模组件开始,比如在一小时内完成的任务。他通过自己周末项目模拟观众来说明这一方法,强调在有限时间内先构建基本功能的重要性。
SSI创始团队分道扬镳,Ilya Sutskever宣布Daniel Gross离开公司并担任新CEO职务;SSI正寻求被收购,但坚持专注于”安全超级智能”理念。