MCP新应用!这个开源神器让网站秒变AI知识库!零代码实现全站内容对话!

 

曾几何时,我们想让 AI 回答某个网站上的问题,往往需要手动爬取页面、清洗内容、接入 API……门槛高、步骤繁、效率低。

同时随着大语言模型(LLM)的普及,利用 AI 处理网站信息的需求也日益增加。涉及编写爬虫、处理数据等繁琐步骤,非技术人员难以操作。

最近,一款 GitHub 上的开源工具: SiteMCP 横空出世,将这一过程简化到极致。它能一键抓取整个网站内容并转化为 MCP 服务器,搭配 Claude 等客户端,即可实现对话式内容查询。

它基于 Node.js 和 Mozilla 的 Readability 技术,支持命令行操作,无需复杂配置即可集成到 MCP 生态,特别适合需要快速获取网站知识的用户。

说白了,SiteMCP 是一款为 Claude 等支持 MCP 协议的 AI 客户端而设计的网站内容转知识库工具,将 AI 与网页信息真正“无缝连接”。

主要功能

  • • 整站抓取并缓存:一键抓取整个网站,所有页面内容本地化存储
  • • 高并发支持:自定义并发数,多线程提升抓取效率
  • • 路径匹配过滤:精准控制抓取页面范围,按需筛选 URL(如只抓文档)
  • • 内容选择器支持:使用 CSS Selector 提取页面主要内容,避免抓到导航、广告等无用数据
  • • 工具命名策略:将网页分块,命令为工具指令,为 MCP 客户端生成结构清晰的方法,便于 AI 调用
  • • MCP Server自动创建:抓完后自动生成一个可被 Claude、Cursor、Cline 等 MCP 客户端调用的 Web 服务

快速上手指南

首先确保系统已安装 Node.js(建议 v18+)

选择以下任一命令方式进行安装:

bun i -g sitemcp
npm i -g sitemcp
pnpm i -g sitemcp

使用方法

基本抓取方式:

sitemcp https://daisyui.com

# or better concurrency
sitemcp https://daisyui.com --concurrency 10

指定路径抓取(网站服务路径):

sitemcp https://daisyui.com -m "/components/**"

设置并发及选择器:

sitemcp https://react.dev --concurrency 5 --content-selector ".main-content"

集成为 MCP 客户端,如 Claude Desktop 添加如下配置:

{
  "mcpServers": {
    "daisy-ui": {
      "command""npx",
      "args": [
        "-y",
        "sitemcp",
        "https://daisyui.com",
        "-m",
        "/components/**"
      ]
    }
  }
}

更多的用法也可参考 GitHub 的 README 文档进行操作。

写在最后

sitemcp = “网站 ➜ AI 知识库”的零门槛工具!

它让 AI 不再是盲问,而是可以真正理解网页内容并回答问题,适合程序员、团队、技术文档管理者、教程内容工作者等广泛场景。

用一句话总结就是:

“一键抓全站 ➜ 自动转知识接口 ➜ Claude、Cursor等 AI 能直接问网站内容!”

GitHub 项目地址:https://github.com/ryoppippi/sitemcp

 

● 一款改变你视频下载体验的神器:MediaGo

● 新一代开源语音库CoQui TTS冲到了GitHub 20.5k Star

● 最新最全 VSCODE 插件推荐(2023版)

● Star 50.3k!超棒的国产远程桌面开源应用火了!

● 超牛的AI物理引擎项目,刚开源不到一天,就飙升到超9K Star!突破物理仿真极限!








(文:开源星探)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往