2 月 2025 - 第14页共241页

手把手教你驯服DeepSeek-R1！部署+测试+性能优化万字全攻略

2025年2月27日23时作者极市干货

何部署和测试DeepSeek-R1模型，涵盖了从Ollama到vLLM的多种推理框架的安装与配置，并

DeepSeek开源优化并行策略，提升训练和通信效率

2025年2月27日23时作者 AIGC开放社区

专注AIGC领域的专业社区分享了开源优化并行策略DualPipe和EPLB。DualPipe用于V3/R1训练中减少流水线气泡，显著提高效率；EPLB通过动态调整专家负载保持平衡，避免通信开销增加。

微软AI技术进阶课第4期【文档智能技术】，锁定3月1日20:00-21:30~

2025年2月27日23时作者 AIGC开放社区

通过下方二维码加入训练营交流群，参与直播并完成注册可获得微软认证结业证书及社区礼包。

所有人都可以大规模预训练MAE – 16倍加速！

2025年2月27日23时作者极市干货

本文提出了一种基于原型驱动的课程学习框架，用于改进掩码图像建模（MIM）的训练过程。在同样的训练时间下，该方法比标准 MAE 训练快16倍学会 NN 任务的视觉表示。

苹果开源通用视觉模型：创新训练方法，超1000颗星

2025年2月27日23时作者 AIGC开放社区

苹果开源的AI模型AIMv2结合图像和文本信息进行预训练，展示了出色的表现。

增长还是盈利：创始人该如何掌控自己的命运？

2025年2月27日19时作者硅谷科技评论

动化分析和智能客服的企业解决方案，目标客户是中小型跨境电商企业。两年前，这家公司还在依赖补贴拉新、烧

与 Agentic AI 相关的开源项目

2025年2月27日16时作者 NLP工程化

Gartner 2025 技术预测中将 Agentic AI 放在首位，AutoGPT、Agent-GPT 等代表产品介绍及其特点。

训练您自己的推理 LLM

2025年2月27日16时作者 NLP工程化

通过Unsloth技术减少90%VRAM使用量训练自己的推理LLM模型

PDF识别大模型 olmOCR-7B-0225-preview

2025年2月27日16时作者 NLP工程化

A 7B model in BF16 format, quantized to around 4GB, can be used on ordinary computers. Reference: https://huggingface.co/allenai/olmOCR-7B-0225-preview.

2025 年 2 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28