月度归档: 2025 年 2 月
10亿AI算力大单!曙光中标
智东西报道:山东省济南市历城区人工智能融合算力中心工程总承包项目中标,由中科曙光国际信息产业有限公司胜出,总中标价格10.6588亿元,提供双精度峰值算力不低于50PFlops@FP64,半精度峰值算力不低于500PFlops@FP16。
200多行代码,复旦大学超低成本复现DeepSeek R1「Aha Moment」!
复旦大学知识工场实验室团队基于 GRPO 算法高效复现 R1-zero 自发反思能力,项目代码简洁、依赖简单,资源消耗低。
在马斯克和奥特曼比谁喊的响的时候,DeepSeek低调发论文,梁文锋亲自参与
DeepSeek发布原生稀疏注意力(NSA)机制,在大语言模型处理64k长文本的速度上最高提升11.6倍,并实现性能反超传统全注意力模型。NSA结合算法创新和硬件优化解决了计算瓶颈,有望显著提升未来基座模型的能力。
Grok还没热,OpenAI就来新基准:百万美元测试,Claude竟拿下40万!
OpenAI发布SWE-Lancer测试基准,评估AI代码能力。该基准基于真实项目任务,涵盖软件工程全栈开发和管理任务,价值100万美元。Claude 3.5 Sonnet表现最佳,但远不及人类开发者水平。