开发者们都懂,看文档是刚需但也是“苦差事”,毕竟对于程序员查阅技术文档是必须要掌握的技能,但往往也是一项耗时且繁琐的任务。
针对这一痛点,DevDocs 应运而生。这款专为程序员设计的开源文档爬取和处理工具,它能自动爬取、提取并组织技术文档,将理解文档所需的时间从数周缩短至几小时,大幅提升开发效率。

DevDocs 通过智能爬取和结构化处理,为开发者提供了一个全新的解决方案。它不仅能快速获取文档,还支持与 AI 工具集成,让文档查询变得像聊天一样简单。
支持从任意技术文档网站提取内容,并将其转化为易于理解的格式。同时它内置 MCP 服务器,可与 Claude、Cursor、Cline 等 AI 应用无缝对接,提供对话式文档查询体验。
通过 Docker 快速部署,让开发者无需复杂配置即可上手。


主要功能
-
• 智能爬取:支持 1-5 层深度的网站结构爬取 -
• 自动链接发现:自动发现链接和子 URL,全面映射网站内容 -
• 并行处理:多线程爬取、智能缓存、速度飞快 -
• 内容清洗优化:去除冗余信息(如广告、导航栏),保证内容干净有用 -
• 多格式输出:支持 Markdown(MD)和 JSON 格式输出 -
• MCP服务器集成:内置 MCP 服务器,支持与 Claude、Cursor、Cline 等 AI 工具对接 -
• Docker快速部署:支持Docker一键部署,开箱即用
快速安装
Docker 一键部署快速使用,十分钟搞定,具体步骤如下:
克隆仓库
git clone https://github.com/cyberagiinc/DevDocs.git
cd DevDocs
Docker快速启动所有服务:
# 适用于 Linux/MacOS 系统
./docker-start.sh
# 适用于 Windows 系统
docker-start.bat
运行成功后,即可访问各种服务
前段 UI: http://localhost:3001
后端 API: http://localhost:24125
Crawl4AI 服务: http://localhost:11235
DevDocs 还有很多实用脚本提供,包括 Crawl4AI 脚本、MCP 服务器脚本及其他小实用功能脚本。可访问项目Readme文档了解。

场景应用示例
-
• 框架/库学习:自动获取整站 API + 示例代码 + 结构关系 -
• AI 训练数据准备:输出结构化 JSON / MD,可用于 RAG、fine-tune -
• 自定义 AI 助手:Claude/Cursor 接入后,实现“问文档 AI 即答” -
• 文档归档:把外部在线文档变成本地离线手册
写在最后
DevDocs 是一个把“技术文档”变成“你和AI都能看懂的知识”的桥梁!
DevDocs = 高质量文档爬虫 + 智能内容清洗器 + AI 知识整合工具
它绝对是程序员和AI开发者的“效率神器”,不仅解决了技术文档难查、难整理的问题,更像是一个可以被你自定义训练的“AI文档助理”。
GitHub 项目地址:https://github.com/cyberagiinc/DevDocs

● 一款改变你视频下载体验的神器:MediaGo
● 新一代开源语音库CoQui TTS冲到了GitHub 20.5k Star
● 最新最全 VSCODE 插件推荐(2023版)
● Star 50.3k!超棒的国产远程桌面开源应用火了!
● 超牛的AI物理引擎项目,刚开源不到一天,就飙升到超9K Star!突破物理仿真极限!

(文:开源星探)