
Mcp read images
集成了 OpenRouter 的视觉模型,可以通过自然语言查询实现图像分析和内容提取。
概述
MCP读取图像
一个使用OpenRouter视觉模型分析图像的MCP服务器。此服务器提供了一个简单的界面,可以通过OpenRouter API使用各种视觉模型(如Claude-3.5-sonnet和Claude-3-opus)来分析图像。
安装
bash
npm install @catalystneuro/mcp_read_images
配置
服务器需要一个OpenRouter API密钥。您可以从OpenRouter获取一个。
将服务器添加到您的MCP设置文件中(通常位于~/Library/Application Support/Code/User/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json,以VSCode为例):
json
{
"mcpServers": {
"read_images": {
"command": "read_images",
"env": {
"OPENROUTER_API_KEY": "your-api-key-here",
"OPENROUTER_MODEL": "anthropic/claude-3.5-sonnet" // 可选,默认值为claude-3.5-sonnet
},
"disabled": false,
"autoApprove": []
}
}
}
使用
服务器提供了一个单一工具analyze_image,可以用来分析图像:
typescript
// 默认模型的基本用法
use_mcp_tool({
server_name: "read_images",
tool_name: "analyze_image",
arguments: {
image_path: "/path/to/image.jpg",
question: "在这个图片中你看到了什么?" // 可选
}
});
// 对于这次调用指定特定模型
use_mcp_tool({
server_name: "read_images",
tool_name: "analyze_image",
arguments: {
image_path: "/path/to/image.jpg",
question: "在这个图片中你看到了什么?",
model: "anthropic/claude-3-opus-20240229" // 覆盖默认值和配置
}
});
模型选择
模型的选择具有以下优先级顺序:
- 工具调用中指定的模型(
model参数) - MCP设置中指定的模型(
OPENROUTER_MODEL环境变量) - 默认模型(anthropic/claude-3.5-sonnet)
支持的模型
以下OpenRouter模型已通过测试:
- anthropic/claude-3.5-sonnet
- anthropic/claude-3-opus-20240229
功能
- 自动调整和优化图像大小
- 可配置的模型选择
- 提供自定义问题支持
- 详细的错误消息
- 自动JPEG转换以及质量优化
错误处理
服务器处理各种错误情况:
- 无效的图像路径
- 缺失的API密钥
- 网络错误
- 无效的模型选择
- 图像处理错误
每种错误都会返回描述性消息以帮助诊断问题。
开发
从源代码构建的步骤:
bash
git clone https://github.com/catalystneuro/mcp_read_images.git
cd mcp_read_images
npm install
npm run build
许可证
MIT 许可证。更多详情,请参阅LICENSE。
