DeepSeek第五弹炸裂收官!开源全新并行文件系统,榨干SSD全部带宽
DeepSeek开源周收官,正式发布高性能文件系统3FS和数据处理框架Smallpond。3FS利用现代SSD和RDMA网络特性,实现了惊人的读取吞吐量,为AI数据处理设定了新基准。
DeepSeek开源周收官,正式发布高性能文件系统3FS和数据处理框架Smallpond。3FS利用现代SSD和RDMA网络特性,实现了惊人的读取吞吐量,为AI数据处理设定了新基准。
OpenAI发布了GPT-4.5模型,强调其情商和实用性。通过两个演示展示了其能力:一是帮助识别并处理用户情绪;二是提供自然且丰富的知识解释方式。此外还介绍了模型开发过程中的细节与技术内幕。
Claude 3.7 Sonnet登顶WebDev竞技场榜首,大幅领先第二名。网友实测惊艳不已,展示了AI编程和网页应用开发的强大能力。
竞技场(lmarena.ai)推出的Prompt-to-leaderboard(P2L)功能,根据输入的Prompt实时排名大模型。通过实验证明其在预测人类偏好方面优于传统的全局排行榜方法,并能更准确评估模型表现。
火山引擎发布AI一体机,提供一站式解决方案支持DeepSeek应用落地,解决算力优化、模型部署及安全防护等问题。
北大团队研究发现,在训练数据中加入随机噪音并不会严重影响语言模型的性能。即使高达20%的数据被污染,模型的预测损失仅上升约1%,并提出局部梯度匹配方法进一步提升其鲁棒性。
本周GPT-4.5即将发布的消息在网络上传开。OpenAI表示,GPT-4.5是Orion模型,也是其新旗舰GPT-4的下一代,并确认GPT-4.5将是最后一个非推理模型。据爆料,GPT-4.5拥有1T激活参数和256K上下文窗口长度,能够制作动画SVG文件并生成音乐。然而,也有测试者表示,在某些任务上其表现不如Claude 3.7 Sonnet。尽管如此,OpenAI计划只向Pro用户开放首批体验GPT-4.5的权限。
英伟达发布2025财年Q4财报:季度营业收入393亿美元,数据中心收入创纪录。全年营业收入1305亿美元,同比增长114%。新产品Blackwell的销售收入达到110亿美元。毛利率为73%,略低于预期。
DeepSeek开源周第四天发布三项优化并行策略的技术成果,包括DualPipe、EPLB和Profiling Data。DualPipe是一种双向流水线并行算法,旨在减少计算与通信阶段的气泡;EPLB是MoE模型负载均衡器,确保计算资源平衡利用;Profiling Data提供了实际应用中的效果数据可视化支持。