Apache License 2.0
120
最近更新:9个月前

RAG Web浏览器Actor的MCP服务器

RAG 网页浏览器 Actor 的模型上下文协议 (MCP) 服务器 🌐

RAG 网页浏览器 Actor 实现的 MCP 服务器。
该 Actor 作为大语言模型 (LLMs) 和 RAG 管道的网页浏览器,类似于 ChatGPT 中的网页搜索功能。

mcp-server-rag-web-browser MCP server

🎯 这个 MCP 服务器有什么功能?

该服务器专为 AI 代理和 LLMs 提供快速响应而设计,使其能够与网页交互并从网页中提取信息。
它在本地运行并与 RAG 网页浏览器 Actor待机模式 通信,
发送搜索查询并接收提取的网页内容作为响应。

RAG 网页浏览器 Actor 允许 AI 助手执行以下操作:

  • 执行网页搜索,从结果中抓取前 N 个 URL,并将其清理后的内容以 Markdown 格式返回
  • 获取单个 URL 并将其内容以 Markdown 格式返回

🧱 组件

工具

  • search: 查询 Google 搜索,从结果中抓取前 N 个 URL,并返回其清理后的内容作为 Markdown。参数:
    • query (字符串,必填): 搜索词或 URL
    • maxResults (数字,可选): 要抓取的搜索结果最大数量 (默认: 1)
    • scrapingTool (字符串,可选): 选择用于提取网页的抓取工具。选项: 'browser-playwright' 或 'raw-http' (默认: 'raw-http')
    • outputFormats (数组,可选): 选择一个或多个输出格式。选项: 'text', 'markdown', 'html' (默认: ['markdown'])
    • requestTimeoutSecs (数字,可选): 请求的最大时间(秒)(默认: 40)

🔄 什么是模型上下文协议?

模型上下文协议 (MCP) 是一个框架,使 AI 应用程序(如 Claude Desktop)能够无缝连接外部工具和数据源。
欲了解更多详情,请访问 模型上下文协议网站 或阅读博客文章 什么是 MCP 及其重要性?

🤖 MCP 服务器如何与 AI 代理集成?

MCP 服务器使 AI 代理能够使用 RAG 网页浏览器 Actor 执行网页搜索和浏览。
要全面了解 AI 代理,请查看我们的博客文章: 什么是 AI 代理? 并探索 Apify 的 代理

有兴趣在 Apify 上构建和货币化您自己的 AI 代理吗?查看我们的 逐步指南 了解如何在 Apify 平台上创建、发布和货币化 AI 代理。

🔌 Apify 提供的相关 MCP 服务器和客户端

该服务器通过标准输入/输出 (stdio) 运行,为 AI 代理提供简单的连接。Apify 还提供了其他几个 MCP 相关工具:

服务器选项

  • 🖥️ 这个 MCP 服务器 – 一个基于本地 stdio 的服务器,用于直接与 Claude Desktop 集成
  • 🌐 通过 SSE 的 RAG 网页浏览器 Actor – 无需运行本地服务器即可通过服务器发送事件直接访问 RAG 网页浏览器
  • 🇦 MCP 服务器 Actor – 为 AI 代理提供访问 4,000 多个专业 Apify Actors 的 MCP 服务器

客户端选项

🛠️ 配置

先决条件

  • MacOS 或 Windows
  • 必须安装最新版本的 Claude Desktop(或其他 MCP 客户端)
  • Node.js (v18 或更高版本)
  • Apify API 令牌 (APIFY_TOKEN)

安装

按照以下步骤在本地机器上设置和运行服务器:
首先,使用以下命令克隆仓库:

bash 复制代码
git clone git@github.com:apify/mcp-server-rag-web-browser.git

进入项目目录并安装所需依赖:

bash 复制代码
cd mcp-server-rag-web-browser
npm install

在运行服务器之前,需要构建项目:

bash 复制代码
npm run build

Claude Desktop

配置 Claude Desktop 以识别 MCP 服务器。

  1. 打开您的 Claude Desktop 配置并编辑以下文件:

    • 在 macOS 上: ~/Library/Application\ Support/Claude/claude_desktop_config.json
    • 在 Windows 上: %APPDATA%/Claude/claude_desktop_config.json
    text 复制代码
    "mcpServers": {
      "rag-web-browser": {
        "command": "npx",
        "args": [
          "@apify/mcp-server-rag-web-browser"
        ],
        "env": {
           "APIFY_TOKEN": "your-apify-api-token"
        }
      }
    }
  2. 重启 Claude Desktop

    • 完全退出 Claude Desktop(确保不只是最小化或关闭)。
    • 重新启动 Claude Desktop。
    • 查找 🔌 图标以确认服务器已连接。
  3. 示例

    您可以要求 Claude 执行网页搜索,例如:

    text 复制代码
    什么是 MCP 服务器及其用途?
    什么是 LLM,最近有什么新闻更新?
    查找并分析关于 LLM 的最新研究论文。

使用 MCP 检查器 调试服务器

bash 复制代码
export APIFY_TOKEN=your-apify-api-token
npx @modelcontextprotocol/inspector npx -y @apify/mcp-server-rag-web-browser

👷🏼 开发

本地客户端 (stdio)

要本地测试服务器,可以使用 example_client_stdio.ts:

bash 复制代码
export APIFY_TOKEN=your-apify-api-token
node dist/example_client_stdio.js

该脚本将启动 MCP 服务器,获取可用工具,然后使用查询调用 search 工具。

直接 API 调用

要测试直接调用 RAG 网页浏览器 Actor:

bash 复制代码
export APIFY_TOKEN=your-apify-api-token
node dist/example_call_web_browser.js

调试

由于 MCP 服务器通过标准输入/输出 (stdio) 运行,调试可能具有挑战性。
为了获得最佳调试体验,请使用 MCP 检查器

构建 mcp-server-rag-web-browser 包:

bash 复制代码
npm run build

您可以通过 npm 使用以下命令启动 MCP 检查器:

bash 复制代码
export APIFY_TOKEN=your-apify-api-token
npx @modelcontextprotocol/inspector node dist/index.js

启动后,检查器将显示一个 URL,您可以在浏览器中访问该 URL 开始调试。