webfetch
đ npm version
đ CI
đ License: MIT
đ Discord
đ GitHub stars
Die lizenzorientierte Bild-Ebene fĂŒr KI-Agenten und Menschen.
Ein MCP-Server, ein CLI und ein HTTP-Server, die ĂŒber 25 Bildanbieter föderieren, Ergebnisse nach Lizenzen priorisieren und UNKNOWN-Ergebnisse standardmĂ€Ăig ablehnen. Jeder Agent, der MCP spricht (Claude Code, Cursor, Cline, Continue, Roo Code, Codex), lĂ€sst sich mit einer einzigen Konfigurationszeile anbinden. Landingpage, Preise und gehostete Nutzung finden Sie unter getwebfetch.com.
Installation
OberflÀche | Einzeiler | |
npm |
| |
Homebrew |
| |
Docker |
| |
curl | bash |
|
Das curl | bash-Installationsprogramm bindet webfetch auĂerdem idempotent in die ~/.claude/settings.json von Claude Code ein. FĂŒhren Sie es jederzeit erneut aus, um ein Update durchzufĂŒhren.
Related MCP server: Wikimedia-Search-Images
30-Sekunden-Nutzung
CLI:
webfetch search "drake portrait" --limit 5
webfetch artist "Taylor Swift" --kind portrait --min-width 1200
webfetch download <url> --out ./portrait.jpg
printf "drake portrait\nradiohead album\n" | webfetch batch --jsonl --continue-on-errorMCP (aus einem MCP-fÀhigen Agenten heraus):
search_images({ query: "drake portrait", limit: 5 })
search_artist_images({ artist: "Taylor Swift", kind: "portrait" })
download_image({ url: "..." })TypeScript-Bibliothek:
import { searchArtistImages, pickBest, downloadImage } from "webfetch-core";
const { candidates } = await searchArtistImages("Drake", "portrait");
const best = pickBest(candidates, { minWidth: 1200 });
if (best) {
const { cachedPath, sha256 } = await downloadImage(best.url);
console.log(best.attributionLine, "->", cachedPath);
}Welches Problem dies löst
Das manuelle Beschaffen eines Bildes hat vier Fehlerquellen:
Sie kennen die Lizenz nicht, daher können Sie das Ergebnis nicht sicher verwenden.
Sie können es nicht skripten â jede neue Website bedeutet einen weiteren Nachmittag Arbeit.
Die Google Image Search API wurde eingestellt; Scraping ist fehleranfÀllig und rechtlich in einer Grauzone.
Kein gemeinsamer Cache â Sie laden dieselbe Datei dutzende Male herunter.
webfetch behebt alle vier Probleme, indem es ĂŒber APIs direkter Quellen föderiert, die stabile Bedingungen und strukturierte Lizenzmetadaten bieten, Kandidaten nach Lizenzen priorisiert und das Ergebnis als einzelnes MCP-Tool bereitstellt.
Anbieter
Anbieter | Deckt ab | Standard-Lizenz | Authentifizierung | Opt-in |
wikimedia | PortrĂ€ts, Events, Logos, Geschichte | CC_BY_SA (Metadaten) | â | nein |
openverse | alle CC-lizenzierten Inhalte | CC_BY (Metadaten) | â | nein |
unsplash | hochwertige Fotografie |
|
| nein |
pexels | Stockfotografie |
|
| nein |
pixabay | Stockfotos + Illustrationen |
|
| nein |
itunes | Albumcover, KĂŒnstlerportrĂ€ts | EDITORIAL_LICENSED | â | nein |
musicbrainz-caa | kanonische Albumcover | EDITORIAL_LICENSED | â | nein |
spotify | KĂŒnstler- + Album-Bilder | EDITORIAL_LICENSED |
| nein |
youtube-thumb | Video-Thumbnails | EDITORIAL_LICENSED | â | ja |
brave | allgemeine Websuche | UNKNOWN (+Heuristik) |
| nein |
bing | allgemeine Websuche | UNKNOWN (+Heuristik) |
| ja |
serpapi | Google Bilder + RĂŒckwĂ€rtssuche | UNKNOWN (+Heuristik) |
| ja |
browser | Headless-Fallback vs images.google.com | UNKNOWN | â | ja |
managed-browser | Bright Data Managed Browser Fallback | UNKNOWN |
| ja |
flickr | CC / Public-Domain-Fotografie | CC_BY (Metadaten) |
| nein |
internet-archive | Public-Domain / CC Archivmedien | PUBLIC_DOMAIN | â | nein |
smithsonian | Open Access Museum-Medien | CC0 |
| nein |
nasa | NASA-Bildmaterial | PUBLIC_DOMAIN | â | nein |
met-museum | The Met Open Access | CC0 | â | nein |
europeana | EuropÀisches Kulturerbe | CC_BY (Metadaten) |
| nein |
library-of-congress | US-historisches Archiv | PUBLIC_DOMAIN | â | nein |
wellcome-collection | medizinische/historische Bilder | CC_BY (Metadaten) | â | nein |
rawpixel | CC0 Stock-Auswahl | CC0 |
| nein |
burst | Shopify Burst Stockfotos | CC0 | â | nein |
europeana-archival | Europeana Text-/Manuskript-DatensÀtze | CC_BY (Metadaten) |
| ja |
Siehe docs/PROVIDERS.md fĂŒr Fallstricke, Ratenbegrenzungen und docs/PROVIDER_TUNING.md fĂŒr Empfehlungen je nach Anwendungsfall.
Lokale und Cloud-Modi
Das CLI ist lokal orientiert: StandardmĂ€Ăig rufen webfetch search, artist, album, download, probe, license und batch webfetch-core im Prozess auf und verwenden Anbieter-API-SchlĂŒssel aus Ihrer Umgebung. Ăbergeben Sie --cloud oder setzen Sie WEBFETCH_MODE=cloud, um https://api.getwebfetch.com/v1/* mit WEBFETCH_API_KEY oder webfetch config set apiKey wf_live_... aufzurufen.
Verwenden Sie den lokalen Modus, wenn Sie direkte Anbieteraufrufe und einen lokalen Cache wĂŒnschen. Verwenden Sie den Cloud-Modus, wenn Sie gehostete Authentifizierung, gepoolte AnbieterschlĂŒssel, Managed-Browser-Fallback, Nutzungsabrechnung oder Team-Kontrollen benötigen.
Warum lizenzorientiert?
Das einzige Ergebnis, das wir standardmĂ€Ăig ablehnen, ist ein Bild, das wir nicht rechtfertigen können. Ein geringfĂŒgig besseres Foto unter einer unbekannten Lizenz ist wertlos fĂŒr eine Pipeline, die ohne menschliche ĂberprĂŒfung auskommen muss. Relevanz-GleichstĂ€nde sind leicht aufzulösen; Herkunftsnachweise nicht.
Die Sortierung erfolgt nach: Lizenz-Tag -> Metadaten-Konfidenz -> Auflösung -> Anbieter-PrioritĂ€t. UNKNOWN wird standardmĂ€Ăig abgelehnt (Berner Ăbereinkunft: Das meiste im Web ist urheberrechtlich geschĂŒtzt, sofern nicht anders bewiesen). Siehe docs/LICENSE_POLICY.md.
Migration: CC0-Stock-Anbieter
Ăltere webfetch-Builds behandelten Unsplash, Pexels und Pixabay als CC0. Aktuelle Builds legen deren Plattformbedingungen explizit offen:
Alter Tag | Neuer Tag | Was zu prĂŒfen ist |
|
| Unsplash-Bedingungen; keine Creative Commons |
|
| Pexels-Bedingungen; keine Creative Commons |
|
| Pixabay-Bedingungen; keine Creative Commons |
Die meisten Aufrufer sollten licensePolicy: "safe-only" beibehalten, da dies weiterhin offene, Plattform-, redaktionelle und Presse-Kategorien erlaubt, wÀhrend UNKNOWN abgelehnt wird. Pipelines, die nur Creative Commons oder Public-Domain-Assets benötigen, sollten licensePolicy: "open-only" verwenden und Typ-WÀchter aktualisieren, um die drei Plattform-Tags separat zu behandeln.
webfetch vs. Alternativen
FĂ€higkeit | webfetch | Raw Google Images | Nur Unsplash | Bing CSE |
Skriptbar via API | ja | nein (eingestellt) | ja | ja |
Lizenz-Metadaten pro Ergebnis | ja | nein | ja (eine Lizenz) | teilweise |
Deckt redaktionelle Musik-Art ab | ja | teilweise | nein | teilweise |
Deckt CC / Public-Domain ab | ja | nein | nein | nein |
Sicher-standardmĂ€Ăig (lehnt UNKNOWN ab) | ja | n/a | n/a | nein |
Gemeinsamer inhaltsadressierter Cache | ja | nein | nein | nein |
Attributionszeile vorgefertigt | ja | nein | nein | nein |
Eine MCP-Konfigurationszeile fĂŒr alle IDEs | ja | nein | nein | nein |
Keine Kosten pro Abfrage bei Standards | ja | n/a | ja | nein |
Architektur
+------------------+
| webfetch-core |
| (ranker, cache, |
| license coerce)|
+---------+--------+
|
+----------------+-----------+-----------+----------------+
| | | |
+-------v------+ +------v-------+ +-------v------+ +------v-------+
| webfetch | | webfetch-mcp | | webfetch- | | browser |
| CLI | | (stdio) | | server (HTTP)| | extensions |
+-------+------+ +------+-------+ +-------+------+ +------+-------+
| | | |
| | | |
+----------------+-----------+-----------+----------------+
|
+---------------------v---------------------+
| provider adapters |
| wikimedia openverse unsplash pexels |
| pixabay itunes mb-caa spotify |
| youtube brave bing serpapi |
| flickr nasa met europeana |
| loc wellcome rawpixel burst |
| browser + managed-browser + archival opt-in|
+-------------------------------------------+Jede OberflĂ€che teilt sich ~/.webfetch/cache/, indiziert durch SHA-256, sodass ein Download aus dem CLI sofort fĂŒr den MCP-Server verfĂŒgbar ist und umgekehrt.
Sicherheitsstandards
licensePolicy: "safe-only"â offene, Plattform-Lizenz- und redaktionelle/Presse-Kategorien sind erlaubt;UNKNOWNwird abgelehnt.safeSearch: "strict".Opt-in-Anbieter (
youtube-thumb,bing,serpapi,browser,managed-browser,europeana-archival) standardmĂ€Ăig deaktiviert.20 MB Limit pro Download, Content-Type-WĂ€chter, Host-Blockliste.
robots.txtwird bei allgemeinen Seiten-Probes respektiert.
Roadmap
webfetch watchâ Daemon-Modus fĂŒr wiederholte Abfragen / inkrementelle Aktualisierung.Bring-your-own-provider Plugin-API.
Gehostete Ebene unter getwebfetch.com â gepoolte AnbieterschlĂŒssel, Managed-Browser-Fallback, Team-Nutzungs-Dashboard.
Mitwirken
Issues und PRs sind willkommen. FĂŒhren Sie bun install && bun test aus, um zu beginnen. Siehe docs/ fĂŒr bereichsspezifische Referenzdokumentationen.
Lizenz
MIT.
Maintenance
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/ashlrai/webfetch'
If you have feedback or need assistance with the MCP directory API, please join our Discord server
