AI寒武纪，作者每时AI - 第19页共33页

DeepSeek开源第五弹：3FS & Smallpond 颠覆性数据处理神器登场，PB级数据轻松处理

2025年2月28日12时作者 AI寒武纪

刚刚 DeepSeek开源周最后一个开源日推出数据处理神器：3FS和Smallpond。3FS是一款高性能分布式文件系统，提供卓越的读取吞吐量。Smallpond是基于DuckDB和3FS的数据处理框架，旨在简化PB级数据处理流程并充分利用DuckDB高性能分析能力。

超越Sora！阿里正式完全开源最新、最强大的视频生成模型 Wan2.1

2025年2月27日16时作者 AI寒武纪

阿里巴巴通义实验室开源最新视频生成模型Wan2.1系列，亮点包括复杂运动、物理模拟、电影质感等。Wan2.1-I2V-14B为图像到视频领域天花板；Wan2.1-T2V-14B支持中英文文字生成，性能卓越；Wan2.1-T2V-1.3B适合消费级显卡。模型采用3D因果VAE、特征缓存机制等技术。

DeepSeek开源第四弹放大招：一口气放出并行计算优化三剑客「训练速度，GPU利用，优化经验」

2025年2月27日16时作者 AI寒武纪

DeepSeek 开源周第四天推出三剑客，包括DualPipe、EPLB和profile-data项目。DualPipe优化计算与通信重叠；EPLB实现专家并行负载均衡；profile-data提供模型训练和推理的性能分析数据。

DeepSeek开源第三弹：惊人的300行代码驱动R1和V3的训练与推理，超越各种专家内核

2025年2月26日12时作者 AI寒武纪

DeepSeek-AI 发布了 DeepGEMM 库，专为 Hopper GPU 架构的 FP8 矩阵乘法加速。其性能高达 1350+ TFLOPS，代码简洁至仅 300 行。该库支持稠密模型和混合专家模型，并通过多种技术实现高效优化，提供详细实测数据及安装指南。

DeepSeek 开源 DeepEP 高效通信库，专家并行不再是难题！

2025年2月25日16时作者 AI寒武纪

DeepSeek OpenSourceWeek 发布了首个面向MoE模型的开源EP通信库 DeepEP。它提供了高性能All-to-All通信内核、集群内和集群间全面支持，以及训练和推理预填充及推理解码低延迟内核等特性。性能测试显示其在不同场景下都能提供出色的通信性能。

最新！Claude 3.7 Sonnet 即将揭秘：各种关键领域达到顶尖水平

2025年2月25日8时作者 AI寒武纪

亚马逊云服务AWS即将发布Anthropic的Claude 3.7 Sonnet模型，这款升级版模型具备扩展思考能力，用户可自由切换标准思考与高级推理模式。Claude 3.7 Sonnet在代码生成、复杂推理等领域表现出色，适用于AI代理和复杂的AI工作流程。

深夜王炸！刚刚Anthropic发布全球首个混合推理模型与全新代码“神器”：双面王牌组合

2025年2月25日8时作者 AI寒武纪

Anthropic发布Claude 3.7 Sonnet和Claude Code，后者专注于代码能力。Sonnet具备混合推理功能，支持快速响应和深入思考，并提供精细的控制权来调整模型思考时间和输出长度。Claude Code作为智能体编码命令行工具，能显著提升编程效率。此外，Anthropic还展示了Claude 3.7 Sonnet在多个基准测试中的卓越表现，确认其为当前最强大的AI模型之一。

DeepSeek 开源周首日：开源 FlashMLA，AI 推理速度再进化！

2025年2月24日12时作者 AI寒武纪

DeepSeek推出FlashMLA开源项目，专为Hopper架构GPU设计的超高效MLA解码内核现已正式开源。它优化了变长序列场景下的效率，并已在生产环境中使用。亮点包括BF16精度支持、Paged KV Cache以及极高的性能表现。

代码论文全开源！月之暗面发布重磅技术报告：模型训练效率翻倍

2025年2月23日16时作者 AI寒武纪

月之暗面团队发布Muon优化器，显著提升大规模语言模型的训练效率，提出的新模型Moonlight在计算资源节省和性能突破方面表现出色。

重磅！量子科技再突破：中国科学家光量子芯片登上Nature

2025年2月23日12时作者 AI寒武纪

北京大学物理学院现代光学研究所的研究成果首次实现基于集成光量子芯片的连续变量多体纠缠，为大规模量子网络和计算铺平道路。

2026 年 1 月
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31