小贴士:按下Ctrl+D 或 ⌘+D,一键收藏本站,方便下次快速访问!
MIT License
6
最近更新:1年前

集成了 OpenRouter 的视觉模型,可以通过自然语言查询实现图像分析和内容提取。

MCP读取图像

一个使用OpenRouter视觉模型分析图像的MCP服务器。此服务器提供了一个简单的界面,可以通过OpenRouter API使用各种视觉模型(如Claude-3.5-sonnet和Claude-3-opus)来分析图像。

安装

bash 复制代码
npm install @catalystneuro/mcp_read_images

配置

服务器需要一个OpenRouter API密钥。您可以从OpenRouter获取一个。

将服务器添加到您的MCP设置文件中(通常位于~/Library/Application Support/Code/User/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json,以VSCode为例):

json 复制代码
{
  "mcpServers": {
    "read_images": {
      "command": "read_images",
      "env": {
        "OPENROUTER_API_KEY": "your-api-key-here",
        "OPENROUTER_MODEL": "anthropic/claude-3.5-sonnet"  // 可选,默认值为claude-3.5-sonnet
      },
      "disabled": false,
      "autoApprove": []
    }
  }
}

使用

服务器提供了一个单一工具analyze_image,可以用来分析图像:

typescript 复制代码
// 默认模型的基本用法
use_mcp_tool({
  server_name: "read_images",
  tool_name: "analyze_image",
  arguments: {
    image_path: "/path/to/image.jpg",
    question: "在这个图片中你看到了什么?"  // 可选
  }
});

// 对于这次调用指定特定模型
use_mcp_tool({
  server_name: "read_images",
  tool_name: "analyze_image",
  arguments: {
    image_path: "/path/to/image.jpg",
    question: "在这个图片中你看到了什么?",
    model: "anthropic/claude-3-opus-20240229"  // 覆盖默认值和配置
  }
});

模型选择

模型的选择具有以下优先级顺序:

  1. 工具调用中指定的模型(model参数)
  2. MCP设置中指定的模型(OPENROUTER_MODEL环境变量)
  3. 默认模型(anthropic/claude-3.5-sonnet)

支持的模型

以下OpenRouter模型已通过测试:

  • anthropic/claude-3.5-sonnet
  • anthropic/claude-3-opus-20240229

功能

  • 自动调整和优化图像大小
  • 可配置的模型选择
  • 提供自定义问题支持
  • 详细的错误消息
  • 自动JPEG转换以及质量优化

错误处理

服务器处理各种错误情况:

  • 无效的图像路径
  • 缺失的API密钥
  • 网络错误
  • 无效的模型选择
  • 图像处理错误

每种错误都会返回描述性消息以帮助诊断问题。

开发

从源代码构建的步骤:

bash 复制代码
git clone https://github.com/catalystneuro/mcp_read_images.git
cd mcp_read_images
npm install
npm run build

许可证

MIT 许可证。更多详情,请参阅LICENSE