图灵奖颁给强化学习师徒,一个造船改行写代码,一个痛批AI投身AGI

计算机最高奖图灵奖揭晓。强化学习先驱Andrew Barto与Richard Sutton共同获奖,他们被评价为’引领基础AI技术开发的研究人员’。两位是师徒关系,Barto和他的博士研究生Sutton将马尔可夫决策过程的数学基础应用于强化学习框架中。

速递|谷歌开源AI模型SpeciesNet,通过图像识别分析物种

谷歌推出Wildlife Insights平台,帮助研究人员在线分享、识别和分析野生动物图像。该平台基于SpeciesNet AI模型训练的超过6500万张公开可用图像,涵盖2000多个标签,加速相机陷阱数据分析。

多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%

研究者提出了一种多元推理方法,结合多种模型和方法来提高推理模型在复杂基准上的准确率。该方法通过交互式定理证明器、代码自动验证和 best-of-N 算法等技术,显著提升了 IMO 组合问题和 ARC 谜题的解决能力,并解决了大量人类无法解答的问题。

谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分

近日,谷歌发布了一项高难度基准BIG-Bench Extra Hard(BBEH),旨在评估AI模型的高阶推理能力。该基准包含了23个任务,并将每个任务替换为更难的任务,覆盖更多方面的技能需求。如o3-mini (high)得分为44.8分不及格,而其它模型得分不超过10分。

谷歌发布最强「科研辅助神器」!能帮你提新idea,三大真实场景实证

新智元报道
编辑:LRS
谷歌、斯坦福大学等机构开发的AI co-scientist系统,基于Gemini 2.0开发,能生成新的研究假设和实验方案,并通过自我改进提升结果质量。该系统在生物医学应用中成功预测药物再利用方向、提出新治疗靶点并解释抗菌耐药机制。