2 月 2025 - 第17页共241页

HumanUP：从机器人自主起身到contact-rich locomotion任务的讨论

2025年2月27日16时作者机器之心

论文提出了一种基于强化学习的两阶段训练框架，成功让G1人形机器人在现实世界中自主起身，并适应多种复杂地形。

速递｜英伟达黄仁勋强调DeepSeek利好英伟达，将2025年实现强劲增长

2025年2月27日16时作者 Z Potentials

Nvidia CEO 黄仁勋在财报电话会议上重申DeepSeek不会影响销售，并强调其旗下的R1模型对Nvidia来说是重大利好消息。黄仁勋还宣布NVIDIA专为推理定制的最新Blackwell芯片需求强劲，公司收入创纪录达到393亿美元。

MLSys’25 极低内存消耗：用SGD的内存成本实现AdamW的优化性能

2025年2月27日16时作者机器之心

UT Austin 和 Meta AI 推出的 APOLLO 方法首次实现了在类 SGD 内存成本下训练大模型，显著降低内存需求并提升性能。

DeepSeek开源三箭齐发，梁文峰亲自上阵！双向并行LLM训练飙升

2025年2月27日16时作者新智元

DeepSeek在开源第四天发布DualPipe和EPLB两个项目，优化了大模型训练速度、成本并保持顶尖性能。

3500元，人形机器人1:1复刻人类动作上海AI Lab开源新成果

2025年2月27日16时作者量子位

今照进现实了。
话不多说，请看VCR：
原来，这是上海AI Lab最新推出的人形机器人“驾驶舱”——

速递｜阿里通义万相Wan2.1，向全球免费开放AI视频生成模型

2025年2月27日16时作者 Z Potentials

阿里巴巴开源其Wan2.1系列中的四个模型，作为与OpenAI等专有模型竞争的新一步。这些模型通过阿里云的Model Scope和Hugging Face提供，并免费向全球开放使用。

DeepSeek开源周第四天：一口气开源3个项目，训练速度，GPU利用，优化经验

2025年2月27日16时作者 Founder Park

这次发布包括三个主要项目：
DualPipe- 一种用于 V3/R1 训练的双向流水线并行算法，实

CVPR 2025录用率22.1%，LeCun中奖！大模型参评，审稿人19篇论文被拒

2025年2月27日16时作者新智元

CVPR 2025录用结果出炉，共有2878篇论文被接收，录用率为22.1%。审稿过程中发现不负责行为，19篇论文被拒。华人担任重要委员会职务，学术界努力提升质量和透明度。

DeepSeek一口气开源3个项目，还有梁文锋亲自参与，昨晚API大降价

2025年2月27日16时作者机器之心

DeepSeek 发布了DualPipe和EPLB两个新工具以及训练和推理框架的分析数据，旨在帮助社区更好地理解通信-计算重叠策略和底层实现细节。

DeepSeek今日连开3源！针对优化的并行策略，梁文锋本人参与开发

2025年2月27日16时作者量子位

DeepSeek开源周第四天发布三项优化并行策略的技术成果，包括DualPipe、EPLB和Profiling Data。DualPipe是一种双向流水线并行算法，旨在减少计算与通信阶段的气泡；EPLB是MoE模型负载均衡器，确保计算资源平衡利用；Profiling Data提供了实际应用中的效果数据可视化支持。

2025 年 2 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28