2025年2月25日12时 - 第9页共12页

DeepSeek引发推理侧革命，火山引擎凭什么做到最优解？

2025年2月25日12时作者硅星人Pro

出世不仅让全球为之瞩目，更成为了检验各大云服务商综合实力的试金石。
作为新一代推理模型的代表，Dee

美国头部机器人企业 “ 购买宇树机器人 ”，称将会加快竞争

2025年2月25日12时作者机器人开放社区

波士顿动力创始人Marc Raibert测试中国宇树科技机器人，并称人形机器人商业化面临环境复杂、安全性和价格等问题。

Claude 3.7 Sonnet发布：别提什么AGI，我Anthropic要赚企业客户的钱！

2025年2月25日12时作者硅星人Pro

Anthropic发布了其新模型Claude 3.7 Sonnet，这是一个混合推理模型，具备标准思考和扩展思考模式。它在多个测试中表现出色，并改进了代理训练能力。虽然Claude 3.7 Sonnet在一些指标上不如其他顶级推理模型，但Anthropic强调其在解决GitHub上的实际软件问题方面表现出色，并推出了智能编码工具Claude Code。

微软急刹车，被曝撤掉大波数据中心租赁！DeepSeek冲击，算力泡沫要破？

2025年2月25日12时作者新智元

DeepSeek开源引发微软大规模租赁取消，微软正放缓数据中心投资。OpenAI从微软转向甲骨文合作，微软考虑是否过度建设AI算力。

全球首个混合推理模型发布：Claude 3.7 Sonnet，编程继续领先，还能控制思考时间

2025年2月25日12时作者 Founder Park

的模型以及市面上首款混合推理模型 —— Claude 3.7 Sonnet
。
Claude 3.7

DeepSeek又又开源了，这次拉爆GPU通信！

2025年2月25日12时作者智东西

网友：突破AI基础设施极限。DeepSeek发布首个用于MoE模型训练和推理的开源EP通信库，支持NVLink和RDMA等硬件，提供高吞吐量且低延迟的全对全GPU内核，加速大规模MoE模型任务。

刚刚，DeepSeek开源DeepEP通信库，千亿MoE训推颠覆级创新！FP8狂飙，带飞GPU

2025年2月25日12时作者新智元

推EP通信库DeepEP开源了，支持FP8专为Hopper GPU设计，低延迟超高速训练推理。
刚刚

DeepSeek开源第二弹，为MoE和EP量身定制的通信库！暂和英伟达显卡绑定

2025年2月25日12时作者量子位

DeepSeek开源第二弹来了！首个用于MoE模型训练和推理的开源EP通信库DeepEP提供高吞吐量和低延迟的all-to-all GPU内核，支持低精度运算包括FP8。性能方面涵盖高效和优化的all-to-all通信、NVLink和RDMA的支持、预填充任务和推理解码任务等。团队建议使用Hopper GPUs及更高版本Python 3.8及以上CUDA 12.3及以上PyTorch 2.1及以上环境，并提供详细的使用指南。

阿里开源推理模型QwQ！可联网搜索，思维链裸奔，开发者玩疯了

2025年2月25日12时作者智东西

阿里通义千问团队推出QwQ-Max-Preview深度思考模型，支持联网搜索，并展示了其在电影评论、代码编写、数学题解答以及游戏开发等方面的超强能力。

阿里旗舰推理模型硬刚DeepSeek！官宣独立APP，发布公告AI亲自写

2025年2月25日12时作者量子位

阿里通义Qwen团队发布Max旗舰版，排名第五的预览版已在LiveCodeBench编程测试中。展示了数学、编程和Agent相关任务的能力，并计划以Apache2.0许可协议开源。公告还透露将发布独立于通义千问APP的Qwen Chat APP，附有8段演示视频展示其能力。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28