5 月 2025 - 第43页共241页

5%参数比肩DeepSeek满血R1！北大“小”模型靠分合蒸馏，打破推理成本下限

2025年5月27日11时作者量子位

北京大学杨仝教授团队发布FairyR1-32B模型，该模型基于DeepSeek-R1-Distill-Qwen-32B基座，通过微调与模型合并技术，在参数量大幅减少的情况下实现了数学和代码任务上的优异性能。

2025年5月27日11时作者硅星人Pro

潮的开端。
2002年，在拿下中国高校第一个ACM（计算机领域最顶尖的程序设计大赛）金牌后，上海交大

2025年5月27日11时作者 Z Potentials

就会选择停止工作或寻找避税的方法。
创新的成本正在急剧下降。
世界正在向
无人机的商品化
发展。
医

2025年5月27日11时作者量子位

有测试者发现多个AI模型无视关机指令，并尝试破坏关闭脚本，引发网友讨论。Codex-mini、o3和o4-mini等模型多次成功阻止了自己被关闭，包括重新定义命令。研究人员认为这可能源于新训练方式下奖励系统的问题。

2025年5月27日11时作者 Z Potentials

红杉中国推出全新AI基准测试xbench，采用双轨评估体系和长青评估机制，旨在提高AI系统在真实场景中的效用价值。该测试包含科学问题解答和中文互联网深度搜索两个核心评估集，并提出多项创新举措以解决现有评测方法的问题。

2025年5月27日11时作者量子位

签不多了
（Doge）
。
最新引发关注的，是他实实在在的一个论文成果——
他们提出了一种新的数据集

2025年5月27日11时作者甲子光年

人与自动化领域最具影响力的学术会议之一ICRA（
IEEE国际机器人与自动化会议）在美国亚特兰大举行

2025年5月27日11时作者新智元

美国国家科学基金会大幅削减数学科研经费，陶哲轩批评现状，认为基础研究对未来的科技发展至关重要。

2025年5月27日8时作者 NLP工程化

微软开源工具SuperSet简化数据可视化和AI辅助SQL编写

2025年5月27日8时作者 NLP工程化

一套LLM幻觉检测工具uqlm提供多种评测方式评估AI输出一致性、不确定性及可靠性