OpenAI 前员工们大闹硅谷!离职 CTO 卷走大半骨干创业、联创公开 37 页训练 PPT,还有现员工准备出走
Mira Murati 离职 OpenAI 后创立新公司 Thinking Machines Lab,目标是打造能让更多人理解和使用的 AI 系统。该公司由前 OpenAI、DeepMind 和谷歌员工组成,Murati 表示将公开发布技术研究和代码。
Mira Murati 离职 OpenAI 后创立新公司 Thinking Machines Lab,目标是打造能让更多人理解和使用的 AI 系统。该公司由前 OpenAI、DeepMind 和谷歌员工组成,Murati 表示将公开发布技术研究和代码。
南方科技大学薛其坤院士团队最新研究成果首次让镍基化合物突破麦克米兰极限,实现优异层状生长的超导体。平均年龄仅28岁的年轻团队开发出一种精确控制原子层次的逐原子层生长方法。
Kimi研究团队提出的MoBA注意力机制显著提升了处理1M和10M长文本的速度,相比传统方法快了6.5倍和16倍。MoBA通过将上下文划分为块,并采用参数无关的top-k门控机制选择最相关的块来高效处理长序列数据。
DeepSeek提出NSA稀疏注意力机制,显著降低大模型训练成本。实验表明,在64k上下文时,NSA前向传播速度最高提升9倍,反向传播速度提升6倍,解码速度提升11.6倍。论文已在arXiv上发布,梁文锋等DeepSeek原班人马参与。
OpenAI发布SWE-Lancer基准测试,评估AI模型在现实任务中的编码能力。Anthropic的Claude 3.5 Sonnet表现最佳,挣得403,325美元报酬,远超GPT-4o和o1模型。
2025年斯隆研究奖揭晓,126位学者获奖。其中,3位北大数院校友、4位清华校友及多所高校的优秀学者获得认可。华人占比近四分之一。姚班继续保持蝉联计算机领域的荣誉。