NLP工程化，作者每时AI

Search-R1：高效、可扩展的强化学习训练框架

2025年3月2日8时作者 NLP工程化

高效、可扩展的强化学习训练框架Search-R1，支持3B规模的基础LLM，通过规则化奖励机制让LLM自主学会推理和搜索，提供完整的训练流程和工具支持。

Prompt Optimizer：一个强大的提示词优化工具

2025年3月2日8时作者 NLP工程化

Prompt Optimizer：一键提升AI回复准确度的工具，支持多轮智能优化及主流AI模型，数据安全无忧。

一款基于 AI 的趋势发现和内容发布系统：TrendPublish

2025年3月1日8时作者 NLP工程化

GitHub 上的 TrendPublish 是一款基于 AI 的趋势发现和内容发布系统，支持多源数据采集、AI 智能处理，并可将内容自动发布到微信公众号。

DeepSeek Profile Data：深度剖析计算与通信重叠策略

2025年3月1日8时作者 NLP工程化

DeepSeek Profile Data详细介绍V3/R1版本中计算与通信重叠策略，并提供详细的性能分析数据，使用PyTorch Profiler可视化。

DeepSeek在开源周最后一天发布的萤火文件系统 (3FS)

2025年3月1日8时作者 NLP工程化

DeepSeek发布的萤火文件系统3FS专为AI训练中的模型批量读取样本数据场景设计，通过Direct IO和异步对齐的读取方式提高性能，减少了服务端的数据加载时间。

DeepSeek开源的EPLB：用于专家并行负载均衡的开源算法

2025年3月1日8时作者 NLP工程化

DeepSeek开源的EPLB算法用于优化多GPU深度学习模型训练，提升效率并支持灵活的负载均衡策略，代码开源方便部署。

与 Agentic AI 相关的开源项目

2025年2月27日16时作者 NLP工程化

Gartner 2025 技术预测中将 Agentic AI 放在首位，AutoGPT、Agent-GPT 等代表产品介绍及其特点。

训练您自己的推理 LLM

2025年2月27日16时作者 NLP工程化

通过Unsloth技术减少90%VRAM使用量训练自己的推理LLM模型

PDF识别大模型 olmOCR-7B-0225-preview

2025年2月27日16时作者 NLP工程化

A 7B model in BF16 format, quantized to around 4GB, can be used on ordinary computers. Reference: https://huggingface.co/allenai/olmOCR-7B-0225-preview.

提升Grok-3等大模型交互效率和效果的提示词工程技巧

2025年2月27日16时作者 NLP工程化

围绕如何有效使用Grok-3模型进行提示词工程，文章介绍了Prompt的基本结构框架，并举例说明了提升效率的六个Top Grok-3 Prompt示例。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31