VOOZH about

URL: https://glama.ai/mcp/servers/ashlrai/webfetch?locale=ja-JP

⇱ webfetch by ashlrai | Glama


webfetch

👁 npm version
👁 CI
👁 License: MIT
👁 Discord
👁 GitHub stars

AIエージェントと人間のための、ライセンス優先型画像レイヤー。

1つのMCPサーバー、1つのCLI、1つのHTTPサーバーが25の画像プロバイダーを統合し、ライセンスを優先して結果をランク付けし、デフォルトで UNKNOWN(不明)な結果を拒否します。MCPに対応したエージェント(Claude Code、Cursor、Cline、Continue、Roo Code、Codexなど)は、1行の設定で接続可能です。ランディングページ、価格設定、ホスト型サービスの利用については getwebfetch.com をご覧ください。

インストール

インターフェース

ワンライナー

npm

npm i -g getwebfetch

Homebrew

brew tap ashlrai/webfetch && brew install webfetch

Docker

docker run --rm ghcr.io/ashlrai/webfetch cli help

curl

bash

`curl -fsSL https://raw.githubusercontent.com/ashlrai/webfetch/main/install/install.sh

bash`

curl | bash インストーラーは、Claude Codeの ~/.claude/settings.json にもwebfetchを自動的に設定します。いつでも再実行して更新可能です。

Related MCP server: Wikimedia-Search-Images

30秒でわかる使い方

CLI:

webfetch search "drake portrait" --limit 5
webfetch artist "Taylor Swift" --kind portrait --min-width 1200
webfetch download <url> --out ./portrait.jpg
printf "drake portrait\nradiohead album\n" | webfetch batch --jsonl --continue-on-error

MCP (MCP対応エージェント内から):

search_images({ query: "drake portrait", limit: 5 })
search_artist_images({ artist: "Taylor Swift", kind: "portrait" })
download_image({ url: "..." })

TypeScriptライブラリ:

import { searchArtistImages, pickBest, downloadImage } from "webfetch-core";

const { candidates } = await searchArtistImages("Drake", "portrait");
const best = pickBest(candidates, { minWidth: 1200 });
if (best) {
 const { cachedPath, sha256 } = await downloadImage(best.url);
 console.log(best.attributionLine, "->", cachedPath);
}

解決する課題

手動で画像を調達する場合、4つの失敗モードがあります:

  1. ライセンスが不明なため、安全に結果を出荷できない。

  2. スクリプト化できない — 新しいサイトごとに午後の時間を費やすことになる。

  3. Google画像検索APIが廃止された — スクレイピングは壊れやすく、利用規約(ToS)のグレーゾーンである。

  4. 共有キャッシュがない — 同じファイルを何度もダウンロードし直すことになる。

webfetchは、安定した利用規約と構造化されたライセンスメタデータを持つ直接ソースAPIを統合し、ライセンスを優先して候補をランク付けし、結果を単一のMCPツールとして公開することで、これら4つの問題を解決します。

プロバイダー

プロバイダー

対象

デフォルトライセンス

認証

オプトイン

wikimedia

ポートレート、イベント、ロゴ、歴史

CC_BY_SA (メタデータ)

いいえ

openverse

CCライセンスコンテンツ全般

CC_BY (メタデータ)

いいえ

unsplash

高品質写真

UNSPLASH_LICENSE

UNSPLASH_ACCESS_KEY

いいえ

pexels

ストックフォト

PEXELS_LICENSE

PEXELS_API_KEY

いいえ

pixabay

ストックフォト + イラスト

PIXABAY_LICENSE

PIXABAY_API_KEY

いいえ

itunes

アルバムカバー、アーティストポートレート

EDITORIAL_LICENSED

いいえ

musicbrainz-caa

標準アルバムアート

EDITORIAL_LICENSED

いいえ

spotify

アーティスト + アルバム画像

EDITORIAL_LICENSED

SPOTIFY_CLIENT_ID/SECRET

いいえ

youtube-thumb

動画サムネイル

EDITORIAL_LICENSED

はい

brave

一般的なWeb画像検索

UNKNOWN (+ヒューリスティック)

BRAVE_API_KEY

いいえ

bing

一般的なWeb画像検索

UNKNOWN (+ヒューリスティック)

BING_API_KEY

はい

serpapi

Google画像検索 + 逆画像検索

UNKNOWN (+ヒューリスティック)

SERPAPI_KEY

はい

browser

ヘッドレスフォールバック vs images.google.com

UNKNOWN

はい

managed-browser

Bright Data管理ブラウザフォールバック

UNKNOWN

BRIGHTDATA_API_TOKEN

はい

flickr

CC / パブリックドメイン写真

CC_BY (メタデータ)

FLICKR_API_KEY

いいえ

internet-archive

パブリックドメイン / CCアーカイブメディア

PUBLIC_DOMAIN

いいえ

smithsonian

オープンアクセス博物館メディア

CC0

SMITHSONIAN_API_KEY

いいえ

nasa

NASA画像

PUBLIC_DOMAIN

いいえ

met-museum

メトロポリタン美術館オープンアクセス

CC0

いいえ

europeana

欧州文化遺産

CC_BY (メタデータ)

EUROPEANA_API_KEY

いいえ

library-of-congress

米国歴史アーカイブ

PUBLIC_DOMAIN

いいえ

wellcome-collection

医療/歴史画像

CC_BY (メタデータ)

いいえ

rawpixel

CC0ストック素材

CC0

RAWPIXEL_API_KEY (任意)

いいえ

burst

Shopify Burstストックフォト

CC0

いいえ

europeana-archival

Europeanaテキスト/原稿記録

CC_BY (メタデータ)

EUROPEANA_API_KEY

はい

注意点やレート制限については docs/PROVIDERS.md を、ユースケースごとの選択については docs/PROVIDER_TUNING.md を参照してください。

ローカルモードとクラウドモード

CLIはローカルファーストです。デフォルトでは webfetch searchartistalbumdownloadprobelicensebatch はプロセス内で webfetch-core を呼び出し、環境変数からプロバイダーのAPIキーを使用します。--cloud を渡すか WEBFETCH_MODE=cloud を設定すると、WEBFETCH_API_KEY または webfetch config set apiKey wf_live_... を使用して https://api.getwebfetch.com/v1/* を呼び出します。

直接プロバイダーを呼び出し、ローカルキャッシュを利用したい場合はローカルモードを使用してください。ホスト型の認証、プロバイダーキーのプール、管理ブラウザのフォールバック、使用量管理、チーム制御が必要な場合はクラウドモードを使用してください。

なぜ「ライセンス優先」なのか

私たちがデフォルトで拒否する唯一の結果は、正当性を証明できない画像です。ライセンスが不明な、わずかに見栄えが良いだけの写真は、人間のレビューなしで出荷する必要があるパイプラインにとっては無価値です。関連性の順位付けは簡単ですが、出所の証明はそうではありません。

ランキングは以下の順序で行われます:ライセンスタグ -> メタデータの信頼性 -> 解像度 -> プロバイダーの優先度UNKNOWN はデフォルトで拒否されます(ベルヌ条約:Web上のほとんどのコンテンツは、証明されない限り「全権利留保」とみなされます)。詳細は docs/LICENSE_POLICY.md を参照してください。

移行:CC0ストックプロバイダー

以前のwebfetchビルドでは、Unsplash、Pexels、Pixabayを CC0 として扱っていました。現在のビルドでは、各プラットフォームの利用規約を明示的に公開しています:

旧タグ

新タグ

確認事項

CC0 (Unsplash)

UNSPLASH_LICENSE

Unsplashの利用規約(Creative Commonsではありません)

CC0 (Pexels)

PEXELS_LICENSE

Pexelsの利用規約(Creative Commonsではありません)

CC0 (Pixabay)

PIXABAY_LICENSE

Pixabayの利用規約(Creative Commonsではありません)

ほとんどの呼び出し元は、licensePolicy: "safe-only" を維持すべきです。これにより、オープン、プラットフォームライセンス、エディトリアル、プレス向けカテゴリを許可しつつ、UNKNOWN を拒否できます。Creative Commonsまたはパブリックドメインの資産のみを必要とするパイプラインは、licensePolicy: "open-only" を使用し、3つのプラットフォームタグを個別に処理するように型ガードを更新してください。

webfetchと代替手段の比較

機能

webfetch

Google画像検索(生)

Unsplashのみ

Bing CSE

API経由でスクリプト化可能

はい

いいえ (廃止)

はい

はい

結果ごとのライセンスメタデータ

はい

いいえ

はい (1種のみ)

部分的

エディトリアル音楽アートをカバー

はい

部分的

いいえ

部分的

CC / パブリックドメインをカバー

はい

いいえ

いいえ

いいえ

デフォルトで安全 (UNKNOWNを拒否)

はい

該当なし

該当なし

いいえ

コンテンツアドレス指定可能な共有キャッシュ

はい

いいえ

いいえ

いいえ

帰属表示行が構築済み

はい

いいえ

いいえ

いいえ

全IDEで共通のMCP設定

はい

いいえ

いいえ

いいえ

デフォルトでクエリごとのコストなし

はい

該当なし

はい

いいえ

アーキテクチャ

 +------------------+
 | webfetch-core |
 | (ranker, cache, |
 | license coerce)|
 +---------+--------+
 |
 +----------------+-----------+-----------+----------------+
 | | | |
 +-------v------+ +------v-------+ +-------v------+ +------v-------+
 | webfetch | | webfetch-mcp | | webfetch- | | browser |
 | CLI | | (stdio) | | server (HTTP)| | extensions |
 +-------+------+ +------+-------+ +-------+------+ +------+-------+
 | | | |
 | | | |
 +----------------+-----------+-----------+----------------+
 |
 +---------------------v---------------------+
 | provider adapters |
 | wikimedia openverse unsplash pexels |
 | pixabay itunes mb-caa spotify |
 | youtube brave bing serpapi |
 | flickr nasa met europeana |
 | loc wellcome rawpixel burst |
 | browser + managed-browser + archival opt-in|
 +-------------------------------------------+

すべてのインターフェースは ~/.webfetch/cache/ をSHA-256でキー付けして共有しているため、CLIからのダウンロードは即座にMCPサーバーでも利用可能であり、その逆も同様です。

安全性のデフォルト設定

  • licensePolicy: "safe-only" — オープン、プラットフォームライセンス、エディトリアル/プレス向けカテゴリは許可され、UNKNOWN は拒否されます。

  • safeSearch: "strict"

  • オプトインプロバイダー (youtube-thumb, bing, serpapi, browser, managed-browser, europeana-archival) はデフォルトでオフ。

  • ダウンロードごとに20MBの制限、コンテンツタイプガード、ホストブロックリスト。

  • 一般的なページ調査では robots.txt を尊重。

ロードマップ

  • webfetch watch — 繰り返しクエリや増分更新のためのデーモンモード。

  • 独自のプロバイダーを追加できるプラグインAPI。

  • getwebfetch.com でのホスト型ティア — プロバイダーキーのプール、管理ブラウザのフォールバック、チーム使用量ダッシュボード。

貢献

IssueやPRを歓迎します。bun install && bun test を実行して開始してください。各エリアのリファレンスドキュメントは docs/ を参照してください。

ライセンス

MIT。

A
license - permissive license
A
quality
A
maintenance

Maintenance

Maintainers
Response time
Release cycle
1Releases (12mo)
Commit activity

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/ashlrai/webfetch'

If you have feedback or need assistance with the MCP directory API, please join our Discord server