MCP-Server mit Browsernutzung
MCP-Server zur Browsernutzung .
Überblick
Dieses Repository enthält den Server für die Browser-Use -Bibliothek. Diese stellt ein leistungsstarkes Browser-Automatisierungssystem bereit, das KI-Agenten die Interaktion mit Webbrowsern über natürliche Sprache ermöglicht. Der Server basiert auf dem Model Context Protocol (MCP) von Anthropic und bietet eine nahtlose Integration mit der Browser-Use- Bibliothek.
Related MCP server: Cloudflare Playwright MCP
Merkmale
Browsersteuerung
Automatisierte Browserinteraktionen über natürliche Sprache
Navigations-, Formularausfüll-, Klick- und Scrollfunktionen
Tab-Verwaltung und Screenshot-Funktionalität
Cookie- und Statusverwaltung
Agentensystem
Benutzerdefinierte Agentimplementierung in custom_agent.py
Bildbasierte Elementerkennung
Strukturierte JSON-Antworten für Aktionen
Verwaltung und Zusammenfassung des Nachrichtenverlaufs
Konfiguration
Umgebungsbasierte Konfiguration für API-Schlüssel und -Einstellungen
Chrome-Browsereinstellungen (Debug-Port, Persistenz)
Modellanbieterauswahl und Parameter
Abhängigkeiten
Dieses Projekt basiert auf den folgenden Python-Paketen:
Paket | Version | Beschreibung |
>=10.1.0 | Python Imaging Library (PIL)-Fork, der Ihrem Python-Interpreter Bildverarbeitungsfunktionen hinzufügt. | |
==0.1.19 | Ein leistungsstarkes Browser-Automatisierungssystem, das KI-Agenten die Interaktion mit Webbrowsern über natürliche Sprache ermöglicht. Die Kernbibliothek, die die Browser-Automatisierungsfunktionen dieses Projekts unterstützt. | |
>=0,115,6 | Modernes, schnelles (leistungsstarkes) Webframework zum Erstellen von APIs mit Python 3.7+ basierend auf standardmäßigen Python-Typhinweisen. Wird zum Erstellen des Servers verwendet, der die Funktionalität des Agenten bereitstellt. | |
>=0,4,1 | Ein Framework, das FastAPI zum Erstellen von MCP-Servern (Model Context Protocol) umschließt. | |
>=1,7,2 | Bibliothek zur strukturierten Ausgabeaufforderung und Validierung mit OpenAI-Modellen. Ermöglicht das Extrahieren strukturierter Daten aus Modellantworten. | |
>=0,3,14 | Framework für die Entwicklung von Anwendungen mit großen Sprachmodellen (LLMs). Bietet Tools zum Verketten verschiedener Sprachmodellkomponenten und zur Interaktion mit verschiedenen APIs und Datenquellen. | |
>=2.1.1 | LangChain-Integration für Google GenAI-Modelle, die die Nutzung der generativen KI-Funktionen von Google innerhalb des LangChain-Frameworks ermöglicht. | |
>=0,2,14 | LangChain-Integrationen mit OpenAI-Modellen. Ermöglicht die Verwendung von OpenAI-Modellen (wie GPT-4) innerhalb des LangChain-Frameworks. Wird in diesem Projekt für die Interaktion mit den Sprach- und Bildmodellen von OpenAI verwendet. | |
>=0,2,2 | Langchain-Integration für Ollama, die die lokale Ausführung von LLMs ermöglicht. | |
>=1,59,5 | Offizielle Python-Clientbibliothek für die OpenAI-API. Wird zur direkten Interaktion mit OpenAI-Modellen verwendet (bei Bedarf zusätzlich zu LangChain). | |
>=1.0.1 | Liest Schlüssel-Wert-Paare aus einer | |
>=2.10.5 | Datenvalidierung und Einstellungsverwaltung mithilfe von Python-Typannotationen. Ermöglicht die Laufzeitdurchsetzung von Typen und die automatische Modellerstellung. Unverzichtbar für die Definition strukturierter Datenmodelle im Agenten. | |
>=1.9.0 | Plattformübergreifendes Python-Modul zum Kopieren und Einfügen der Zwischenablagefunktionen. | |
>=0,22,0 | ASGI-Webserverimplementierung für Python. Wird zur Bereitstellung der FastAPI-Anwendung verwendet. |
Komponenten
Ressourcen
Der Server implementiert ein Browser-Automatisierungssystem mit:
Integration mit Browser-Nutzungsbibliothek für erweiterte Browsersteuerung
Benutzerdefinierte Browser-Automatisierungsfunktionen
Agentenbasiertes Interaktionssystem mit Vision-Funktionen
Persistente Zustandsverwaltung
Anpassbare Modelleinstellungen
Anforderungen
Betriebssysteme (Linux, macOS, Windows; wir haben nicht für Docker oder Microsoft WSL getestet)
Python 3.11 oder höher
uv (schneller Python-Paketinstaller)
Chrome/Chromium-Browser
Schnellstart
Claude Desktop
Unter MacOS: ~/Library/Application\ Support/Claude/claude_desktop_config.json Unter Windows: %APPDATA%/Claude/claude_desktop_config.json
Installation über Smithery
So installieren Sie Browser Use für Claude Desktop automatisch über Smithery :
npx -y @smithery/cli install @JovaniPink/mcp-browser-use --client claude"mcpServers": {
"mcp_server_browser_use": {
"command": "uvx",
"args": [
"mcp-server-browser-use",
],
"env": {
"OPENAI_ENDPOINT": "https://api.openai.com/v1",
"OPENAI_API_KEY": "",
"ANTHROPIC_API_KEY": "",
"GOOGLE_API_KEY": "",
"AZURE_OPENAI_ENDPOINT": "",
"AZURE_OPENAI_API_KEY": "",
// "DEEPSEEK_ENDPOINT": "https://api.deepseek.com",
// "DEEPSEEK_API_KEY": "",
// Set to false to disable anonymized telemetry
"ANONYMIZED_TELEMETRY": "false",
// Chrome settings
"CHROME_PATH": "",
"CHROME_USER_DATA": "",
"CHROME_DEBUGGING_PORT": "9222",
"CHROME_DEBUGGING_HOST": "localhost",
// Set to true to keep browser open between AI tasks
"CHROME_PERSISTENT_SESSION": "false",
// Model settings
"MCP_MODEL_PROVIDER": "anthropic",
"MCP_MODEL_NAME": "claude-3-5-sonnet-20241022",
"MCP_TEMPERATURE": "0.3",
"MCP_MAX_STEPS": "30",
"MCP_USE_VISION": "true",
"MCP_MAX_ACTIONS_PER_STEP": "5",
"MCP_TOOL_CALL_IN_CONTENT": "true"
}
}
}Umgebungsvariablen
Wichtige Umgebungsvariablen:
# API Keys
ANTHROPIC_API_KEY=anthropic_key
# Chrome Configuration
# Optional: Path to Chrome executable
CHROME_PATH=/path/to/chrome
# Optional: Chrome user data directory
CHROME_USER_DATA=/path/to/user/data
# Default: 9222
CHROME_DEBUGGING_PORT=9222
# Default: localhost
CHROME_DEBUGGING_HOST=localhost
# Keep browser open between tasks
CHROME_PERSISTENT_SESSION=false
# Model Settings
# Options: anthropic, openai, azure, deepseek
MCP_MODEL_PROVIDER=anthropic
# Model name
MCP_MODEL_NAME=claude-3-5-sonnet-20241022
MCP_TEMPERATURE=0.3
MCP_MAX_STEPS=30
MCP_USE_VISION=true
MCP_MAX_ACTIONS_PER_STEP=5Entwicklung
Aufstellen
Klonen Sie das Repository:
git clone https://github.com/JovaniPink/mcp-browser-use.git
cd mcp-browser-useVirtuelle Umgebung erstellen und aktivieren:
python -m venv .venv
source .venv/bin/activate # On Windows: .venv\Scripts\activateInstallieren Sie Abhängigkeiten:
uv syncStarten Sie den Server
uv run mcp-browser-useDebuggen
Verwenden Sie zum Debuggen den MCP Inspector :
npx @modelcontextprotocol/inspector uv --directory /path/to/project run mcp-server-browser-useDer Inspector zeigt eine URL für die Debugging-Schnittstelle an.
Browseraktionen
Der Server unterstützt verschiedene Browseraktionen durch natürliche Sprache:
Navigation: Zu URLs gehen, zurück/vorwärts, aktualisieren
Interaktion: Klicken, tippen, scrollen, schweben
Formulare: Formulare ausfüllen, absenden, Optionen auswählen
Status: Seiteninhalt abrufen, Screenshots machen
Tabs: Tabs erstellen, schließen, zwischen Tabs wechseln
Vision: Elemente anhand der visuellen Erscheinung finden
Cookies und Speicher: Browserstatus verwalten
Sicherheit
Ich möchte darauf hinweisen, dass einige Chrome-Einstellungen die Steuerung des Browsers durch den Server ermöglichen. Dies stellt ein Sicherheitsrisiko dar und sollte mit Vorsicht verwendet werden. Der Server ist nicht für den Einsatz in einer Produktionsumgebung vorgesehen.
Sicherheitsdetails: SECURITY.MD
Beitragen
Wir freuen uns über Beiträge zu diesem Projekt. Bitte folgen Sie diesen Schritten:
Forken Sie dieses Repository.
Erstellen Sie Ihren Feature-Zweig:
git checkout -b my-new-feature.Übernehmen Sie Ihre Änderungen:
git commit -m 'Add some feature'.Pushen zum Zweig:
git push origin my-new-feature.Senden Sie eine Pull-Anfrage.
Bei größeren Änderungen öffnen Sie zunächst ein Problem, um zu besprechen, was Sie ändern möchten. Bitte aktualisieren Sie die Tests entsprechend, um die vorgenommenen Änderungen zu berücksichtigen.
Maintenance
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/JovaniPink/mcp-browser-use'
If you have feedback or need assistance with the MCP directory API, please join our Discord server
