ScienceMeter:专注于语言模型中科学知识更新的评测工具

ScienceMeter是专注于语言模型中科学知识更新的评测工具,涵盖10个领域,支持多款评测脚本及内置基线训练示例,数据集包含论文的支持与反驳合成科学论断,代码开源供科研人员使用、反馈和贡献。

吴恩达:产品经理才是 AI 时代的最大瓶颈

AI 编程助手让代码编写变得快捷,但决定做什么成为了新的瓶颈。斯坦福教授吴恩达指出这被称为‘产品管理瓶颈’,产品经理比程序员更稀缺。他认为好的产品经理应凭直觉做出决策,并完善用户的心智模型来制定快速正确的决策。

IMO 主席正式宣布:Google DeepMind在国际数学奥赛拿下金牌!

Google DeepMind 的Gemini模型在2025年国际数学奥林匹克竞赛中取得了金牌水平的成绩,直接用自然语言解决了世界上最难的数学题。然而,在宣布之前,OpenAI抢先发布了自己的成绩。DeepMind随后表示已准备好分享他们的解决方案。