梁文锋归档 - 每时AI

DeepSeek-R2 推迟发布？一场关于性能、芯片与时机的博弈

2025年7月1日14时作者 AI信息Gap

DeepSeek-R2 模型因 CEO 对性能不满及美国出口管制影响而推迟发布，目前面临算力短缺问题。该模型原计划在 2025 年初发布，但已延期多周，团队正尝试通过国产替代和优化模型结构来重新建立发布条件。

DeepSeek-R2为什么还没发？

2025年6月27日23时作者量子位

DeepSeek-R2再次被曝推迟发布，原因包括CEO不满意R2的表现和研发过程中缺少英伟达H20芯片。此前有传言称R1训练需要3万块H20、1万块H800和1万块H100，而R2预计会耗费更多算力资源。

梁文锋急招CFO，要融资了？

2025年4月2日11时作者硅星人Pro

我们投出梁文锋？”
自从年初DeepSeek火了之后，各地开展了一轮又一轮自省会，拿着政府引导基金的

为什么是梁文锋做出了DeepSeek？

2025年3月27日23时作者极市干货

2025年初，DeepSeek科技的创始人梁文锋因独特个性和卓越能力受到关注。他重视人才选拔与管理方式，并不以商业化为限，专注于AGI研发。

深度｜关于Manus我们所知道的一切，一个和DeepSeek截然相反的产品故事

2025年3月7日23时作者智东西

Agent产品
Manus
横空出世，瞬间点燃科技圈。此刻，所有AI爱好者都在疯抢
Manus邀请码

一文看懂 DeepSeek 开源第四弹，梁文锋亲自下场开发

2025年2月27日16时作者 APPSO

DeepSeek 在 OpenSourceWeek 开源了两项 AI 训练加速技术，包括 DualPipe 和 EPLB。DualPipe 通过双向计算与通信提升了训练效率；EPLB 则优化了 MoE 架构中的资源分配，显著提高 GPU 的利用率。

DeepSeek一口气开源3个项目，还有梁文锋亲自参与，昨晚API大降价

2025年2月27日16时作者机器之心

DeepSeek 发布了DualPipe和EPLB两个新工具以及训练和推理框架的分析数据，旨在帮助社区更好地理解通信-计算重叠策略和底层实现细节。

DeepSeek今日连开3源！针对优化的并行策略，梁文锋本人参与开发

2025年2月27日16时作者量子位

DeepSeek开源周第四天发布三项优化并行策略的技术成果，包括DualPipe、EPLB和Profiling Data。DualPipe是一种双向流水线并行算法，旨在减少计算与通信阶段的气泡；EPLB是MoE模型负载均衡器，确保计算资源平衡利用；Profiling Data提供了实际应用中的效果数据可视化支持。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31