VOOZH about

URL: https://glama.ai/mcp/servers/simonamsharp/routewise-mcp?locale=es-ES

⇱ whichmodel-mcp by simonamsharp | Glama


whichmodel-mcp

Un asesor de enrutamiento de modelos para agentes autónomos: obtén recomendaciones de LLM optimizadas por coste a través de MCP.

whichmodel.dev realiza un seguimiento de los precios y capacidades de más de 100 modelos LLM, actualizados cada 4 horas. Este servidor MCP expone esos datos para que los agentes de IA puedan elegir el modelo adecuado al mejor precio para cada tarea.

Punto de conexión MCP

https://whichmodel.dev/mcp

Transporte: HTTP transmitible (especificación MCP 2025-03-26)

Related MCP server: ai-compass

Inicio rápido

Añádelo a la configuración de tu cliente MCP:

{
 "mcpServers": {
 "whichmodel": {
 "url": "https://whichmodel.dev/mcp"
 }
 }
}

No se requiere clave API. No es necesaria instalación.

Stdio (clientes locales)

Para clientes MCP que utilizan transporte stdio (Claude Desktop, Cursor, etc.):

{
 "mcpServers": {
 "whichmodel": {
 "command": "npx",
 "args": ["-y", "whichmodel-mcp"]
 }
 }
}

Esto ejecuta un proxy local ligero que reenvía las solicitudes al servidor remoto.

Herramientas

recommend_model

Obtén una recomendación de modelo optimizada por coste para un tipo de tarea, complejidad y presupuesto específicos.

Parámetro

Tipo

Descripción

task_type

enum (requerido)

chat, code_generation, code_review, summarisation, translation, data_extraction, tool_calling, creative_writing, research, classification, embedding, vision, reasoning

complexity

low

medium

high

Complejidad de la tarea (predeterminado: medium)

estimated_input_tokens

number

Tamaño de entrada esperado en tokens

estimated_output_tokens

number

Tamaño de salida esperado en tokens

budget_per_call

number

Gasto máximo en USD por llamada

requirements

object

Requisitos de capacidad: tool_calling, json_output, streaming, context_window_min, providers_include, providers_exclude

Devuelve: modelo recomendado, alternativa, opción de presupuesto, estimación de costes y razonamiento.


compare_models

Comparación directa de 2 a 5 modelos con proyecciones de costes por volumen opcionales.

Parámetro

Tipo

Descripción

models

string[] (requerido)

IDs de modelo, p. ej. [anthropic/claude-sonnet-4, openai/gpt-4.1]

task_type

enum

Contexto para la comparación

volume

object

calls_per_day, avg_input_tokens, avg_output_tokens para proyecciones de costes diarios/mensuales

Devuelve: precios, capacidades, niveles de calidad y costes proyectados por modelo.


get_pricing

Búsqueda de datos de precios sin procesar con filtros por modelo, proveedor, límite de precio y capacidades.

Parámetro

Tipo

Descripción

model_id

string

ID de modelo específico

provider

string

Filtrar por proveedor, p. ej. anthropic

max_input_price

number

Precio máximo de entrada por millón de tokens (USD)

capabilities

string[]

Capacidades requeridas: tool_calling, json_output, streaming, vision

min_context_window

number

Ventana de contexto mínima en tokens

limit

number

Resultados máximos (1–100, predeterminado 20)


check_price_changes

Consulta qué precios de modelos han cambiado desde una fecha determinada.

Parámetro

Tipo

Descripción

since

string (requerido)

Fecha ISO, p. ej. 2026-04-01

model_id

string

Filtrar por un modelo específico

provider

string

Filtrar por un proveedor específico

Devuelve: aumentos de precio, disminuciones, nuevos modelos y depreciaciones.

Integración de agentes

WhichModel está diseñado para ser una herramienta predeterminada en los flujos de trabajo de agentes autónomos. Añádela a cualquier agente para que pueda elegir automáticamente el modelo adecuado al precio correcto para cada subtarea.

Prompt del sistema (copiar y pegar)

Añade este bloque al prompt del sistema de tu agente:

You have access to the WhichModel MCP server for cost-aware model selection.

Before calling any LLM for a subtask, use recommend_model to pick the right model:

 recommend_model({
 task_type: "code_generation", // chat | code_generation | summarisation | reasoning | ...
 complexity: "medium", // low | medium | high
 estimated_input_tokens: 2000, // optional
 estimated_output_tokens: 500, // optional
 budget_per_call: 0.01, // optional hard cap in USD
 requirements: {
 tool_calling: true, // if the subtask needs tool use
 }
 })

Use the returned recommendation.model_id. The response includes cost_estimate and
reasoning so you can log why each model was chosen.

Plantillas de prompt a través de MCP

El servidor expone plantillas de prompt integradas que puedes obtener a través de prompts/get:

Nombre del prompt

Caso de uso

cost-aware-agent

Bloque de prompt del sistema completo para la selección de modelos consciente de los costes

task-router-snippet

Fragmento mínimo para añadir a un prompt del sistema existente

budget-constrained-agent

Límite de coste estricto por llamada (pasa el argumento budget_usd)

Recupéralas programáticamente:

{ "method": "prompts/get", "params": { "name": "cost-aware-agent" } }

Integraciones de frameworks

Actualización de datos

Los datos de precios se actualizan cada 4 horas desde OpenRouter. Cada respuesta incluye una marca de tiempo data_freshness para que sepas qué tan actuales son los datos.

Enlaces

A
license - permissive license
-
quality - not tested
A
maintenance

Maintenance

Maintainers
Response time
Release cycle
1Releases (12mo)
Commit activity

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/simonamsharp/routewise-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server