Servidor MCP con uso del navegador

Servidor MCP para uso del navegador .

Descripción general

Este repositorio contiene el servidor para la biblioteca de uso del navegador , que proporciona un potente sistema de automatización del navegador que permite a los agentes de IA interactuar con los navegadores web mediante lenguaje natural. El servidor se basa en el Protocolo de Contexto de Modelo (MCP) de Anthropic y se integra perfectamente con la biblioteca de uso del navegador .

Related MCP server: Cloudflare Playwright MCP

Características

Control del navegador

Interacciones automatizadas del navegador a través del lenguaje natural
Capacidades de navegación, llenado de formularios, clics y desplazamiento
Gestión de pestañas y funcionalidad de captura de pantalla
Gestión de cookies y estados

Sistema de agentes

Implementación de agente personalizado en custom_agent.py
Detección de elementos basada en visión
Respuestas JSON estructuradas para acciones
Gestión y resumen del historial de mensajes

Configuración

Configuración basada en el entorno para claves y configuraciones de API
Configuración del navegador Chrome (puerto de depuración, persistencia)
Selección del proveedor del modelo y parámetros

Dependencias

Este proyecto se basa en los siguientes paquetes de Python:

Paquete	Versión	Descripción
Almohada	>=10.1.0	Bifurcación de Python Imaging Library (PIL) que agrega capacidades de procesamiento de imágenes a su intérprete de Python.
uso del navegador	==0.1.19	Un potente sistema de automatización de navegadores que permite a los agentes de IA interactuar con los navegadores web mediante lenguaje natural. La biblioteca principal que impulsa las capacidades de automatización de navegadores de este proyecto.
Fastapi	>=0.115.6	Framework web moderno, rápido y de alto rendimiento para crear API con Python 3.7+, basado en sugerencias de tipos estándar de Python. Se utiliza para crear el servidor que expone la funcionalidad del agente.
fastmcp	>=0,4,1	Un marco que envuelve FastAPI para crear servidores MCP (Protocolo de contexto de modelo).
instructor	>=1.7.2	Biblioteca para la generación y validación de resultados estructurados con modelos OpenAI. Permite extraer datos estructurados de las respuestas de los modelos.
cadena larga	>=0,3,14	Marco para el desarrollo de aplicaciones con grandes modelos de lenguaje (LLM). Proporciona herramientas para encadenar diferentes componentes de modelos de lenguaje e interactuar con diversas API y fuentes de datos.
langchain-google-genai	>=2.1.1	Integración de LangChain con los modelos GenAI de Google, que permite el uso de las capacidades de inteligencia artificial generativa de Google dentro del marco de LangChain.
langchain-openai	>=0,2,14	Integración de LangChain con los modelos de OpenAI. Permite usar modelos de OpenAI (como GPT-4) dentro del framework LangChain. Se utiliza en este proyecto para interactuar con los modelos de lenguaje y visión de OpenAI.
langchain-ollama	>=0,2,2	Integración de Langchain para Ollama, que permite la ejecución local de LLM.
openai	>=1,59,5	Biblioteca cliente oficial de Python para la API de OpenAI. Se utiliza para interactuar directamente con los modelos de OpenAI (si es necesario, además de LangChain).
python-dotenv	>=1.0.1	Lee pares clave-valor de un archivo `.env` y los configura como variables de entorno. Simplifica el desarrollo local y la gestión de la configuración.
pidantico	>=2.10.5	Validación de datos y gestión de configuraciones mediante anotaciones de tipos de Python. Permite la aplicación de tipos en tiempo de ejecución y la creación automática de modelos. Esencial para definir modelos de datos estructurados en el agente.
clip de pyper	>=1.9.0	Módulo Python multiplataforma para funciones de copiar y pegar el portapapeles.
uvicornio	>=0,22,0	Implementación del servidor web ASGI para Python. Se utiliza para la aplicación FastAPI.

Componentes

Recursos

El servidor implementa un sistema de automatización del navegador con:

Integración con la biblioteca de uso del navegador para un control avanzado del navegador
Capacidades de automatización del navegador personalizado
Sistema de interacción basado en agentes con capacidades de visión
Gestión de estados persistentes
Configuraciones de modelo personalizables

Requisitos

Sistemas operativos (Linux, macOS, Windows; no hemos realizado pruebas con Docker ni Microsoft WSL)
Python 3.11 o superior
uv (instalador rápido de paquetes de Python)
Navegador Chrome/Chromium
Escritorio de Claude

Inicio rápido

Escritorio de Claude

En MacOS: ~/Library/Application\ Support/Claude/claude_desktop_config.json En Windows: %APPDATA%/Claude/claude_desktop_config.json

Instalación mediante herrería

Para instalar Browser Use for Claude Desktop automáticamente a través de Smithery :

npx -y @smithery/cli install @JovaniPink/mcp-browser-use --client claude

"mcpServers": {
 "mcp_server_browser_use": {
 "command": "uvx",
 "args": [
 "mcp-server-browser-use",
 ],
 "env": {
 "OPENAI_ENDPOINT": "https://api.openai.com/v1",
 "OPENAI_API_KEY": "",
 "ANTHROPIC_API_KEY": "",
 "GOOGLE_API_KEY": "",
 "AZURE_OPENAI_ENDPOINT": "",
 "AZURE_OPENAI_API_KEY": "",
 // "DEEPSEEK_ENDPOINT": "https://api.deepseek.com",
 // "DEEPSEEK_API_KEY": "",
 // Set to false to disable anonymized telemetry
 "ANONYMIZED_TELEMETRY": "false",
 // Chrome settings
 "CHROME_PATH": "",
 "CHROME_USER_DATA": "",
 "CHROME_DEBUGGING_PORT": "9222",
 "CHROME_DEBUGGING_HOST": "localhost",
 // Set to true to keep browser open between AI tasks
 "CHROME_PERSISTENT_SESSION": "false",
 // Model settings
 "MCP_MODEL_PROVIDER": "anthropic",
 "MCP_MODEL_NAME": "claude-3-5-sonnet-20241022",
 "MCP_TEMPERATURE": "0.3",
 "MCP_MAX_STEPS": "30",
 "MCP_USE_VISION": "true",
 "MCP_MAX_ACTIONS_PER_STEP": "5",
 "MCP_TOOL_CALL_IN_CONTENT": "true"
 }
 }
}

Variables de entorno

Variables ambientales clave:

# API Keys
ANTHROPIC_API_KEY=anthropic_key

# Chrome Configuration
# Optional: Path to Chrome executable
CHROME_PATH=/path/to/chrome
# Optional: Chrome user data directory
CHROME_USER_DATA=/path/to/user/data
# Default: 9222
CHROME_DEBUGGING_PORT=9222
# Default: localhost
CHROME_DEBUGGING_HOST=localhost
# Keep browser open between tasks
CHROME_PERSISTENT_SESSION=false

# Model Settings
# Options: anthropic, openai, azure, deepseek
MCP_MODEL_PROVIDER=anthropic
# Model name
MCP_MODEL_NAME=claude-3-5-sonnet-20241022
MCP_TEMPERATURE=0.3
MCP_MAX_STEPS=30
MCP_USE_VISION=true
MCP_MAX_ACTIONS_PER_STEP=5

Desarrollo

Configuración

Clonar el repositorio:

git clone https://github.com/JovaniPink/mcp-browser-use.git
cd mcp-browser-use

Crear y activar entorno virtual:

python -m venv .venv
source .venv/bin/activate # On Windows: .venv\Scripts\activate

Instalar dependencias:

uv sync

Iniciar el servidor

uv run mcp-browser-use

Depuración

Para depurar, utilice el Inspector MCP :

npx @modelcontextprotocol/inspector uv --directory /path/to/project run mcp-server-browser-use

El Inspector mostrará una URL para la interfaz de depuración.

Acciones del navegador

El servidor admite varias acciones del navegador a través del lenguaje natural:

Navegación: Ir a URL, retroceder/avanzar, actualizar
Interacción: hacer clic, escribir, desplazarse, pasar el cursor
Formularios: Complete formularios, envíelos, seleccione opciones
Estado: Obtener el contenido de la página, tomar capturas de pantalla
Pestañas: crear, cerrar, cambiar entre pestañas
Visión: Encuentra elementos por apariencia visual
Cookies y almacenamiento: Administrar el estado del navegador

Seguridad

Cabe señalar que existen algunas configuraciones de Chrome que permiten que el servidor controle el navegador. Esto representa un riesgo de seguridad y debe usarse con precaución. El servidor no está diseñado para usarse en un entorno de producción.

Detalles de seguridad: SECURITY.MD

Contribuyendo

Agradecemos las contribuciones a este proyecto. Siga estos pasos:

Bifurcar este repositorio.
Crea tu rama de características: git checkout -b my-new-feature .
Confirme sus cambios: git commit -m 'Add some feature' .
Empujar a la rama: git push origin my-new-feature .
Enviar una solicitud de extracción.

Para cambios importantes, primero abra una incidencia para comentar qué desea cambiar. Actualice las pruebas según corresponda para reflejar los cambios realizados.

Install Server

license - permissive license

quality - not tested

maintenance

How are these scores calculated?

Maintenance

–Maintainers

–Response time

–Release cycle

–Releases (12mo)

Commit activity

Resources

GitHub Repository

Need Help?

Reddit Discussion

Related Servers

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Appeared in Searches

Latest Blog Posts

Lightport: Open-Sourcing Glama's AI Gateway
By punkpeye on April 27, 2026.
open source
OpenAI
Tool Definition Quality Score (TDQS)
By punkpeye on April 3, 2026.
mcp
The Hackers Who Tracked My Sleep Cycle
By punkpeye on March 26, 2026.
security

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/JovaniPink/mcp-browser-use'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

URL: https://glama.ai/mcp/servers/JovaniPink/mcp-browser-use?locale=es-ES

⇱ Servidor de uso del navegador MCP by JovaniPink | Glama