学术
超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分
DeepSeek-R1 在 ARC-AGI 上的表现不及 OpenAI 的 o3 系列模型,但通过 SnakeBench 对抗性基准测试,在 1v1 贪吃蛇比赛中击败了 o1-mini,并接近 o3-mini。
2024 IBM博士生奖学金出炉:韩迟、卓越、张逸骅、冯尚彬等AI研究者入选
多位2024 IBM博士生奖学金得主毕业于国内高校,涉及半导体技术、人工智能等前沿领域。其中包括清华大学、浙江大学等多个知名校友来源高校的研究者。
困在“第一学历”里的博士
MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作,但学历歧视问题依然存在,如企业招聘时卡学校层次或看重第一学历。教育部发布通知禁止此类行为,并建议规范就业歧视内涵。强调学历并非唯一标准,应鼓励终身学习和人才合理使用。
入选AAAI 2025!香港理工大学团队基于图Transformer,精准预测有机材料分子光电性能
Former,通过构建原子-化学环的层级图 Transformer 架构,结合局部消息传递与全局注意
AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零
新基准ENIGMAEVAL对高难度问题提出挑战,显示主流推理模型在面对复杂谜题时准确率极低。研究者使用原始多模态谜题进行评估,发现前沿语言模型即使在普通谜题中表现也仅7.0%,且难以解决困难谜题。