de en es ja ko ru zh

whichmodel-mcp

Un asesor de enrutamiento de modelos para agentes autónomos: obtén recomendaciones de LLM optimizadas por coste a través de MCP.

whichmodel.dev realiza un seguimiento de los precios y capacidades de más de 100 modelos LLM, actualizados cada 4 horas. Este servidor MCP expone esos datos para que los agentes de IA puedan elegir el modelo adecuado al mejor precio para cada tarea.

Punto de conexión MCP

https://whichmodel.dev/mcp

Transporte: HTTP transmitible (especificación MCP 2025-03-26)

Related MCP server: ai-compass

Inicio rápido

Añádelo a la configuración de tu cliente MCP:

{
 "mcpServers": {
 "whichmodel": {
 "url": "https://whichmodel.dev/mcp"
 }
 }
}

No se requiere clave API. No es necesaria instalación.

Stdio (clientes locales)

Para clientes MCP que utilizan transporte stdio (Claude Desktop, Cursor, etc.):

{
 "mcpServers": {
 "whichmodel": {
 "command": "npx",
 "args": ["-y", "whichmodel-mcp"]
 }
 }
}

Esto ejecuta un proxy local ligero que reenvía las solicitudes al servidor remoto.

Herramientas

`recommend_model`

Obtén una recomendación de modelo optimizada por coste para un tipo de tarea, complejidad y presupuesto específicos.

Parámetro	Tipo	Descripción
`task_type`	enum (requerido)	`chat`, `code_generation`, `code_review`, `summarisation`, `translation`, `data_extraction`, `tool_calling`, `creative_writing`, `research`, `classification`, `embedding`, `vision`, `reasoning`
`complexity`	`low`	`medium`	`high`	Complejidad de la tarea (predeterminado: `medium`)
`estimated_input_tokens`	number	Tamaño de entrada esperado en tokens
`estimated_output_tokens`	number	Tamaño de salida esperado en tokens
`budget_per_call`	number	Gasto máximo en USD por llamada
`requirements`	object	Requisitos de capacidad: `tool_calling`, `json_output`, `streaming`, `context_window_min`, `providers_include`, `providers_exclude`

Devuelve: modelo recomendado, alternativa, opción de presupuesto, estimación de costes y razonamiento.

`compare_models`

Comparación directa de 2 a 5 modelos con proyecciones de costes por volumen opcionales.

Parámetro	Tipo	Descripción
`models`	string[] (requerido)	IDs de modelo, p. ej. `[anthropic/claude-sonnet-4, openai/gpt-4.1]`
`task_type`	enum	Contexto para la comparación
`volume`	object	`calls_per_day`, `avg_input_tokens`, `avg_output_tokens` para proyecciones de costes diarios/mensuales

Devuelve: precios, capacidades, niveles de calidad y costes proyectados por modelo.

`get_pricing`

Búsqueda de datos de precios sin procesar con filtros por modelo, proveedor, límite de precio y capacidades.

Parámetro	Tipo	Descripción
`model_id`	string	ID de modelo específico
`provider`	string	Filtrar por proveedor, p. ej. `anthropic`
`max_input_price`	number	Precio máximo de entrada por millón de tokens (USD)
`capabilities`	string[]	Capacidades requeridas: `tool_calling`, `json_output`, `streaming`, `vision`
`min_context_window`	number	Ventana de contexto mínima en tokens
`limit`	number	Resultados máximos (1–100, predeterminado 20)

`check_price_changes`

Consulta qué precios de modelos han cambiado desde una fecha determinada.

Parámetro	Tipo	Descripción
`since`	string (requerido)	Fecha ISO, p. ej. `2026-04-01`
`model_id`	string	Filtrar por un modelo específico
`provider`	string	Filtrar por un proveedor específico

Devuelve: aumentos de precio, disminuciones, nuevos modelos y depreciaciones.

Integración de agentes

WhichModel está diseñado para ser una herramienta predeterminada en los flujos de trabajo de agentes autónomos. Añádela a cualquier agente para que pueda elegir automáticamente el modelo adecuado al precio correcto para cada subtarea.

Prompt del sistema (copiar y pegar)

Añade este bloque al prompt del sistema de tu agente:

You have access to the WhichModel MCP server for cost-aware model selection.

Before calling any LLM for a subtask, use recommend_model to pick the right model:

 recommend_model({
 task_type: "code_generation", // chat | code_generation | summarisation | reasoning | ...
 complexity: "medium", // low | medium | high
 estimated_input_tokens: 2000, // optional
 estimated_output_tokens: 500, // optional
 budget_per_call: 0.01, // optional hard cap in USD
 requirements: {
 tool_calling: true, // if the subtask needs tool use
 }
 })

Use the returned recommendation.model_id. The response includes cost_estimate and
reasoning so you can log why each model was chosen.

Plantillas de prompt a través de MCP

El servidor expone plantillas de prompt integradas que puedes obtener a través de prompts/get:

Nombre del prompt	Caso de uso
`cost-aware-agent`	Bloque de prompt del sistema completo para la selección de modelos consciente de los costes
`task-router-snippet`	Fragmento mínimo para añadir a un prompt del sistema existente
`budget-constrained-agent`	Límite de coste estricto por llamada (pasa el argumento `budget_usd`)

Recupéralas programáticamente:

{ "method": "prompts/get", "params": { "name": "cost-aware-agent" } }

Integraciones de frameworks

LangChain: langchain-whichmodel — cadena WhichModelRouter
Haystack: whichmodel-haystack — componente WhichModelRouter

Actualización de datos

Los datos de precios se actualizan cada 4 horas desde OpenRouter. Cada respuesta incluye una marca de tiempo data_freshness para que sepas qué tan actuales son los datos.

Enlaces

Sitio web: whichmodel.dev
Punto de conexión MCP: https://whichmodel.dev/mcp
Descubrimiento: https://whichmodel.dev/.well-known/mcp.json
Registro nAIm: naim.janis7ewski.org — Registro de servicios de IA; explora la categoría LLM para encontrar WhichModel como fuente de precios en vivo y enlace directo al punto de conexión MCP

This server cannot be installed

license - permissive license

quality - not tested

maintenance

How are these scores calculated?

Maintenance

–Maintainers

–Response time

–Release cycle

1Releases (12mo)

Commit activity

Resources

Need Help?

Related Servers

Latest Blog Posts

Lightport: Open-Sourcing Glama's AI Gateway
By punkpeye on April 27, 2026.
open source
OpenAI
Tool Definition Quality Score (TDQS)
By punkpeye on April 3, 2026.
mcp
The Hackers Who Tracked My Sleep Cycle
By punkpeye on March 26, 2026.
security

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/simonamsharp/routewise-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

URL: https://glama.ai/mcp/servers/simonamsharp/routewise-mcp?locale=es-ES

⇱ whichmodel-mcp by simonamsharp | Glama