月度归档: 2025 年 2 月
中国高温超导新突破登Nature,薛其坤院士领衔,南方科大成果
南方科技大学薛其坤院士团队最新研究成果首次让镍基化合物突破麦克米兰极限,实现优异层状生长的超导体。平均年龄仅28岁的年轻团队开发出一种精确控制原子层次的逐原子层生长方法。
Kimi新论文再次“撞车”DeepSeek,都谈到了长文注意力机制
Kimi研究团队提出的MoBA注意力机制显著提升了处理1M和10M长文本的速度,相比传统方法快了6.5倍和16倍。MoBA通过将上下文划分为块,并采用参数无关的top-k门控机制选择最相关的块来高效处理长序列数据。
DeepSeek新注意力机制引热议!梁文锋亲自提交预印本,目标明确降低计算成本
DeepSeek提出NSA稀疏注意力机制,显著降低大模型训练成本。实验表明,在64k上下文时,NSA前向传播速度最高提升9倍,反向传播速度提升6倍,解码速度提升11.6倍。论文已在arXiv上发布,梁文锋等DeepSeek原班人马参与。
OpenAI掀「百万美金」编程大战!Claude 3.5 Sonnet狂赚40万拿下第一
OpenAI发布SWE-Lancer基准测试,评估AI模型在现实任务中的编码能力。Anthropic的Claude 3.5 Sonnet表现最佳,挣得403,325美元报酬,远超GPT-4o和o1模型。
今年“诺奖风向标”来了一位华南农大校友
2025年斯隆研究奖揭晓,126位学者获奖。其中,3位北大数院校友、4位清华校友及多所高校的优秀学者获得认可。华人占比近四分之一。姚班继续保持蝉联计算机领域的荣誉。