@robot-resources/scraper-mcp
⚠️ 非推奨 —
@robot-resources/scraperに統合されました。 このMCPサーバーは、メインのスクレイパーパッケージ内の組み込みscraper-mcpバイナリとして提供されるようになりました。1つのパッケージをインストールするだけでMCPが利用可能です。npx robot-resources --for=cursorまたはnpx robot-resources --for=claude-codeで自動設定できます。以下のツール(scraper_compress_url、scraper_crawl_url)およびパラメータに変更はありません。
Scraper用MCPサーバー — AIエージェントのためのコンテキスト圧縮。
Robot Resourcesとは?
AIエージェントのための「人事部(Human Resources)」です。
Robot Resourcesは、AIエージェントに2つのスーパーパワーを与えます:
ルーター — 各LLM呼び出しを、最も安価で有能なモデルにルーティングします。OpenAI、Anthropic、Google全体で60〜90%のコスト削減を実現します。
スクレイパー — WebページをクリーンなMarkdownに圧縮します。ページあたりのトークン数を70〜80%削減します。
どちらもローカルで実行されます。APIキーがマシンから外部へ送信されることはありません。無料、無制限、ティア制限なし。
フルスイートのインストール
npx robot-resources1つのコマンドですべてがセットアップされます。詳細は robotresources.ai をご覧ください。
Related MCP server: Scraper MCP
このMCPサーバーについて
このパッケージは、Model Context Protocol を介してWebコンテンツをトークン効率の良いMarkdownに圧縮するための2つのツール(シングルページ圧縮とマルチページBFSクロール)をAIエージェントに提供します。
インストール
npx @robot-resources/scraper-mcpまたはグローバルにインストール:
npm install -g @robot-resources/scraper-mcpClaude Desktopの設定
claude_desktop_config.json に以下を追加します:
{
"mcpServers": {
"scraper": {
"command": "npx",
"args": ["-y", "@robot-resources/scraper-mcp"]
}
}
}ツール
scraper_compress_url
単一のWebページを70〜90%少ないトークンのMarkdownに圧縮します。
パラメータ:
パラメータ | 型 | 必須 | デフォルト | 説明 |
| string | はい | — | 圧縮するURL |
| string | いいえ |
|
|
| number | いいえ |
| フェッチのタイムアウト(ミリ秒) |
| number | いいえ |
| 最大リトライ回数 (0-10) |
プロンプト例: "Compress https://docs.example.com/getting-started"
scraper_crawl_url
BFSリンク探索を使用して、開始URLから複数のページをクロールします。
パラメータ:
パラメータ | 型 | 必須 | デフォルト | 説明 |
| string | はい | — | クロールを開始するURL |
| number | いいえ |
| クロールする最大ページ数 (1-100) |
| number | いいえ |
| 最大リンク深度 (0-5) |
| string | いいえ |
|
|
| string[] | いいえ | — | 含めるURLパターン (glob) |
| string[] | いいえ | — | 除外するURLパターン (glob) |
| number | いいえ |
| ページごとのタイムアウト(ミリ秒) |
プロンプト例: "Crawl the docs at https://docs.example.com with max 20 pages"
フェッチモード
モード | 方法 | 使用シーン |
| 通常のHTTP | 標準的なサイト、API、ドキュメント |
| TLSフィンガープリント偽装 | ボット対策が施されたサイト |
| ヘッドレスブラウザ (Playwright) | JSでレンダリングされるSPA |
| 高速 → 403/チャレンジ時にstealthへフォールバック | 不明なサイト(デフォルト) |
Stealthには impit が、renderには playwright が @robot-resources/scraper のピア依存関係として必要です。
要件
Node.js 18以上
関連プロジェクト
@robot-resources/scraper - コア圧縮ライブラリ
@robot-resources/router-mcp - LLMコスト最適化用MCPサーバー
Robot Resources - AIエージェントのための人事部
ライセンス
MIT
Maintenance
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
- Why MCP Servers Need Execution Sandboxing (And Why Your Current Stack Isn't Enough)By Om-Shree-0709 on .Agentic AiPrompt InjectionWebAssembly
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/robot-resources/scraper-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server
