ICLR 2025|浙大、千问发布预训练数据管理器DataMan,53页细节满满

AIxiv专栏探讨了DataMan数据管理器在优化大语言模型预训练中的应用。该研究提出了一个全面的质量评分体系,用于15个常见应用领域的预训练数据质量评估和领域识别,显著提升了模型性能。

谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分

近日,谷歌发布了一项高难度基准BIG-Bench Extra Hard(BBEH),旨在评估AI模型的高阶推理能力。该基准包含了23个任务,并将每个任务替换为更难的任务,覆盖更多方面的技能需求。如o3-mini (high)得分为44.8分不及格,而其它模型得分不超过10分。

一文详解:DeepSeek 第五天开源的 3FS 文件系统

DeepSeek在开源周发布了支持其V3/R1模型全生命周期的数据访问需求的核心基础设施——Fire-Flyer File System(3FS)和Smallpond数据处理框架。3FS具有高性能、高吞吐量以及强一致性等特性,在大型集群上实现了6.6 TiB/s的聚合读取吞吐量,并且在KVCache查找中的峰值吞吐量可达40+ GiB/s。Smallpond是建立在3FS之上的轻量级数据处理框架,旨在简化大规模数据处理任务。

大摩:英伟达财报并不完美,但过渡期“阵痛”正消退,Blackwell即将迎来全面爆发

摩根士丹利看好英伟达Q4业绩表现,认为其强劲需求将延续至年底。尽管存在毛利率压力和出口管制等挑战,但大摩预计这些因素只是暂时现象。摩根士丹利上调了对英伟达的营收预期,并重申了增持评级,将目标价上调至162美元。对于市场对AI支出可持续性的担忧,摩根士丹利认为AI支出具有周期性,市场热情将在未来6-9个月内重燃。