VOOZH about

URL: https://glama.ai/mcp/servers/JovaniPink/mcp-browser-use?locale=es-ES

⇱ Servidor de uso del navegador MCP by JovaniPink | Glama


Servidor MCP con uso del navegador

👁 insignia de herrería

Servidor MCP para uso del navegador .

Descripción general

Este repositorio contiene el servidor para la biblioteca de uso del navegador , que proporciona un potente sistema de automatización del navegador que permite a los agentes de IA interactuar con los navegadores web mediante lenguaje natural. El servidor se basa en el Protocolo de Contexto de Modelo (MCP) de Anthropic y se integra perfectamente con la biblioteca de uso del navegador .

Related MCP server: Cloudflare Playwright MCP

Características

  1. Control del navegador

  • Interacciones automatizadas del navegador a través del lenguaje natural

  • Capacidades de navegación, llenado de formularios, clics y desplazamiento

  • Gestión de pestañas y funcionalidad de captura de pantalla

  • Gestión de cookies y estados

  1. Sistema de agentes

  • Implementación de agente personalizado en custom_agent.py

  • Detección de elementos basada en visión

  • Respuestas JSON estructuradas para acciones

  • Gestión y resumen del historial de mensajes

  1. Configuración

  • Configuración basada en el entorno para claves y configuraciones de API

  • Configuración del navegador Chrome (puerto de depuración, persistencia)

  • Selección del proveedor del modelo y parámetros

Dependencias

Este proyecto se basa en los siguientes paquetes de Python:

Paquete

Versión

Descripción

Almohada

>=10.1.0

Bifurcación de Python Imaging Library (PIL) que agrega capacidades de procesamiento de imágenes a su intérprete de Python.

uso del navegador

==0.1.19

Un potente sistema de automatización de navegadores que permite a los agentes de IA interactuar con los navegadores web mediante lenguaje natural. La biblioteca principal que impulsa las capacidades de automatización de navegadores de este proyecto.

Fastapi

>=0.115.6

Framework web moderno, rápido y de alto rendimiento para crear API con Python 3.7+, basado en sugerencias de tipos estándar de Python. Se utiliza para crear el servidor que expone la funcionalidad del agente.

fastmcp

>=0,4,1

Un marco que envuelve FastAPI para crear servidores MCP (Protocolo de contexto de modelo).

instructor

>=1.7.2

Biblioteca para la generación y validación de resultados estructurados con modelos OpenAI. Permite extraer datos estructurados de las respuestas de los modelos.

cadena larga

>=0,3,14

Marco para el desarrollo de aplicaciones con grandes modelos de lenguaje (LLM). Proporciona herramientas para encadenar diferentes componentes de modelos de lenguaje e interactuar con diversas API y fuentes de datos.

langchain-google-genai

>=2.1.1

Integración de LangChain con los modelos GenAI de Google, que permite el uso de las capacidades de inteligencia artificial generativa de Google dentro del marco de LangChain.

langchain-openai

>=0,2,14

Integración de LangChain con los modelos de OpenAI. Permite usar modelos de OpenAI (como GPT-4) dentro del framework LangChain. Se utiliza en este proyecto para interactuar con los modelos de lenguaje y visión de OpenAI.

langchain-ollama

>=0,2,2

Integración de Langchain para Ollama, que permite la ejecución local de LLM.

openai

>=1,59,5

Biblioteca cliente oficial de Python para la API de OpenAI. Se utiliza para interactuar directamente con los modelos de OpenAI (si es necesario, además de LangChain).

python-dotenv

>=1.0.1

Lee pares clave-valor de un archivo .env y los configura como variables de entorno. Simplifica el desarrollo local y la gestión de la configuración.

pidantico

>=2.10.5

Validación de datos y gestión de configuraciones mediante anotaciones de tipos de Python. Permite la aplicación de tipos en tiempo de ejecución y la creación automática de modelos. Esencial para definir modelos de datos estructurados en el agente.

clip de pyper

>=1.9.0

Módulo Python multiplataforma para funciones de copiar y pegar el portapapeles.

uvicornio

>=0,22,0

Implementación del servidor web ASGI para Python. Se utiliza para la aplicación FastAPI.

Componentes

Recursos

El servidor implementa un sistema de automatización del navegador con:

  • Integración con la biblioteca de uso del navegador para un control avanzado del navegador

  • Capacidades de automatización del navegador personalizado

  • Sistema de interacción basado en agentes con capacidades de visión

  • Gestión de estados persistentes

  • Configuraciones de modelo personalizables

Requisitos

  • Sistemas operativos (Linux, macOS, Windows; no hemos realizado pruebas con Docker ni Microsoft WSL)

  • Python 3.11 o superior

  • uv (instalador rápido de paquetes de Python)

  • Navegador Chrome/Chromium

  • Escritorio de Claude

Inicio rápido

Escritorio de Claude

En MacOS: ~/Library/Application\ Support/Claude/claude_desktop_config.json En Windows: %APPDATA%/Claude/claude_desktop_config.json

Instalación mediante herrería

Para instalar Browser Use for Claude Desktop automáticamente a través de Smithery :

npx -y @smithery/cli install @JovaniPink/mcp-browser-use --client claude
"mcpServers": {
 "mcp_server_browser_use": {
 "command": "uvx",
 "args": [
 "mcp-server-browser-use",
 ],
 "env": {
 "OPENAI_ENDPOINT": "https://api.openai.com/v1",
 "OPENAI_API_KEY": "",
 "ANTHROPIC_API_KEY": "",
 "GOOGLE_API_KEY": "",
 "AZURE_OPENAI_ENDPOINT": "",
 "AZURE_OPENAI_API_KEY": "",
 // "DEEPSEEK_ENDPOINT": "https://api.deepseek.com",
 // "DEEPSEEK_API_KEY": "",
 // Set to false to disable anonymized telemetry
 "ANONYMIZED_TELEMETRY": "false",
 // Chrome settings
 "CHROME_PATH": "",
 "CHROME_USER_DATA": "",
 "CHROME_DEBUGGING_PORT": "9222",
 "CHROME_DEBUGGING_HOST": "localhost",
 // Set to true to keep browser open between AI tasks
 "CHROME_PERSISTENT_SESSION": "false",
 // Model settings
 "MCP_MODEL_PROVIDER": "anthropic",
 "MCP_MODEL_NAME": "claude-3-5-sonnet-20241022",
 "MCP_TEMPERATURE": "0.3",
 "MCP_MAX_STEPS": "30",
 "MCP_USE_VISION": "true",
 "MCP_MAX_ACTIONS_PER_STEP": "5",
 "MCP_TOOL_CALL_IN_CONTENT": "true"
 }
 }
}

Variables de entorno

Variables ambientales clave:

# API Keys
ANTHROPIC_API_KEY=anthropic_key

# Chrome Configuration
# Optional: Path to Chrome executable
CHROME_PATH=/path/to/chrome
# Optional: Chrome user data directory
CHROME_USER_DATA=/path/to/user/data
# Default: 9222
CHROME_DEBUGGING_PORT=9222
# Default: localhost
CHROME_DEBUGGING_HOST=localhost
# Keep browser open between tasks
CHROME_PERSISTENT_SESSION=false

# Model Settings
# Options: anthropic, openai, azure, deepseek
MCP_MODEL_PROVIDER=anthropic
# Model name
MCP_MODEL_NAME=claude-3-5-sonnet-20241022
MCP_TEMPERATURE=0.3
MCP_MAX_STEPS=30
MCP_USE_VISION=true
MCP_MAX_ACTIONS_PER_STEP=5

Desarrollo

Configuración

  1. Clonar el repositorio:

git clone https://github.com/JovaniPink/mcp-browser-use.git
cd mcp-browser-use
  1. Crear y activar entorno virtual:

python -m venv .venv
source .venv/bin/activate # On Windows: .venv\Scripts\activate
  1. Instalar dependencias:

uv sync
  1. Iniciar el servidor

uv run mcp-browser-use

Depuración

Para depurar, utilice el Inspector MCP :

npx @modelcontextprotocol/inspector uv --directory /path/to/project run mcp-server-browser-use

El Inspector mostrará una URL para la interfaz de depuración.

Acciones del navegador

El servidor admite varias acciones del navegador a través del lenguaje natural:

  • Navegación: Ir a URL, retroceder/avanzar, actualizar

  • Interacción: hacer clic, escribir, desplazarse, pasar el cursor

  • Formularios: Complete formularios, envíelos, seleccione opciones

  • Estado: Obtener el contenido de la página, tomar capturas de pantalla

  • Pestañas: crear, cerrar, cambiar entre pestañas

  • Visión: Encuentra elementos por apariencia visual

  • Cookies y almacenamiento: Administrar el estado del navegador

Seguridad

Cabe señalar que existen algunas configuraciones de Chrome que permiten que el servidor controle el navegador. Esto representa un riesgo de seguridad y debe usarse con precaución. El servidor no está diseñado para usarse en un entorno de producción.

Detalles de seguridad: SECURITY.MD

Contribuyendo

Agradecemos las contribuciones a este proyecto. Siga estos pasos:

  1. Bifurcar este repositorio.

  2. Crea tu rama de características: git checkout -b my-new-feature .

  3. Confirme sus cambios: git commit -m 'Add some feature' .

  4. Empujar a la rama: git push origin my-new-feature .

  5. Enviar una solicitud de extracción.

Para cambios importantes, primero abra una incidencia para comentar qué desea cambiar. Actualice las pruebas según corresponda para reflejar los cambios realizados.

A
license - permissive license
-
quality - not tested
D
maintenance

Maintenance

Maintainers
Response time
Release cycle
Releases (12mo)
Commit activity

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/JovaniPink/mcp-browser-use'

If you have feedback or need assistance with the MCP directory API, please join our Discord server