whichmodel-mcp
Un asesor de enrutamiento de modelos para agentes autónomos: obtén recomendaciones de LLM optimizadas por coste a través de MCP.
whichmodel.dev realiza un seguimiento de los precios y capacidades de más de 100 modelos LLM, actualizados cada 4 horas. Este servidor MCP expone esos datos para que los agentes de IA puedan elegir el modelo adecuado al mejor precio para cada tarea.
Punto de conexión MCP
https://whichmodel.dev/mcpTransporte: HTTP transmitible (especificación MCP 2025-03-26)
Related MCP server: ai-compass
Inicio rápido
Añádelo a la configuración de tu cliente MCP:
{
"mcpServers": {
"whichmodel": {
"url": "https://whichmodel.dev/mcp"
}
}
}No se requiere clave API. No es necesaria instalación.
Stdio (clientes locales)
Para clientes MCP que utilizan transporte stdio (Claude Desktop, Cursor, etc.):
{
"mcpServers": {
"whichmodel": {
"command": "npx",
"args": ["-y", "whichmodel-mcp"]
}
}
}Esto ejecuta un proxy local ligero que reenvía las solicitudes al servidor remoto.
Herramientas
recommend_model
Obtén una recomendación de modelo optimizada por coste para un tipo de tarea, complejidad y presupuesto específicos.
Parámetro | Tipo | Descripción | ||
| enum (requerido) |
| ||
|
|
|
| Complejidad de la tarea (predeterminado: |
| number | Tamaño de entrada esperado en tokens | ||
| number | Tamaño de salida esperado en tokens | ||
| number | Gasto máximo en USD por llamada | ||
| object | Requisitos de capacidad: |
Devuelve: modelo recomendado, alternativa, opción de presupuesto, estimación de costes y razonamiento.
compare_models
Comparación directa de 2 a 5 modelos con proyecciones de costes por volumen opcionales.
Parámetro | Tipo | Descripción |
| string[] (requerido) | IDs de modelo, p. ej. |
| enum | Contexto para la comparación |
| object |
|
Devuelve: precios, capacidades, niveles de calidad y costes proyectados por modelo.
get_pricing
Búsqueda de datos de precios sin procesar con filtros por modelo, proveedor, límite de precio y capacidades.
Parámetro | Tipo | Descripción |
| string | ID de modelo específico |
| string | Filtrar por proveedor, p. ej. |
| number | Precio máximo de entrada por millón de tokens (USD) |
| string[] | Capacidades requeridas: |
| number | Ventana de contexto mínima en tokens |
| number | Resultados máximos (1–100, predeterminado 20) |
check_price_changes
Consulta qué precios de modelos han cambiado desde una fecha determinada.
Parámetro | Tipo | Descripción |
| string (requerido) | Fecha ISO, p. ej. |
| string | Filtrar por un modelo específico |
| string | Filtrar por un proveedor específico |
Devuelve: aumentos de precio, disminuciones, nuevos modelos y depreciaciones.
Integración de agentes
WhichModel está diseñado para ser una herramienta predeterminada en los flujos de trabajo de agentes autónomos. Añádela a cualquier agente para que pueda elegir automáticamente el modelo adecuado al precio correcto para cada subtarea.
Prompt del sistema (copiar y pegar)
Añade este bloque al prompt del sistema de tu agente:
You have access to the WhichModel MCP server for cost-aware model selection.
Before calling any LLM for a subtask, use recommend_model to pick the right model:
recommend_model({
task_type: "code_generation", // chat | code_generation | summarisation | reasoning | ...
complexity: "medium", // low | medium | high
estimated_input_tokens: 2000, // optional
estimated_output_tokens: 500, // optional
budget_per_call: 0.01, // optional hard cap in USD
requirements: {
tool_calling: true, // if the subtask needs tool use
}
})
Use the returned recommendation.model_id. The response includes cost_estimate and
reasoning so you can log why each model was chosen.Plantillas de prompt a través de MCP
El servidor expone plantillas de prompt integradas que puedes obtener a través de prompts/get:
Nombre del prompt | Caso de uso |
| Bloque de prompt del sistema completo para la selección de modelos consciente de los costes |
| Fragmento mínimo para añadir a un prompt del sistema existente |
| Límite de coste estricto por llamada (pasa el argumento |
Recupéralas programáticamente:
{ "method": "prompts/get", "params": { "name": "cost-aware-agent" } }Integraciones de frameworks
LangChain:
langchain-whichmodel— cadenaWhichModelRouterHaystack:
whichmodel-haystack— componenteWhichModelRouter
Actualización de datos
Los datos de precios se actualizan cada 4 horas desde OpenRouter. Cada respuesta incluye una marca de tiempo data_freshness para que sepas qué tan actuales son los datos.
Enlaces
Sitio web: whichmodel.dev
Punto de conexión MCP: https://whichmodel.dev/mcp
Descubrimiento: https://whichmodel.dev/.well-known/mcp.json
Registro nAIm: naim.janis7ewski.org — Registro de servicios de IA; explora la categoría LLM para encontrar WhichModel como fuente de precios en vivo y enlace directo al punto de conexión MCP
This server cannot be installed
Maintenance
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/simonamsharp/routewise-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server
