Enrutamiento

El motor de enrutamiento de GreatRouter es la inteligencia central que conecta tus prompts con el mejor modelo para la tarea. GreatRouter ofrece dos endpoints de enrutamiento:

Enrutamiento automático (/v1/auto/route) — Describe lo que necesitas en lenguaje natural. El router clasifica la intención, selecciona un modelo y envía la solicitud.
Enrutamiento explícito (/v1/models/route) — Especifica el tipo de tarea y los filtros. El router ordena los modelos coincidentes y envía la solicitud.

Parámetros de enrutamiento

Parámetros de enrutamiento automático

Parámetro	Tipo	Predeterminado	Descripción
`prompt`	string	— (obligatorio)	Descripción en lenguaje natural de lo que necesitas
`input`	object	— (obligatorio)	Entrada del modelo (mensajes, parámetros, etc.)
`task`	string	—	Pista: `text`, `image`, `video`, `music`, `speech`, `code`, `web_search`
`content_mode`	string	—	`generate`, `edit` o `combine`
`optimization`	string	`"balanced"`	`price-optimized`, `output-optimized` o `balanced`
`budget_dollars`	number	—	Costo máximo estimado en USD

Parámetros de enrutamiento explícito

Parámetro	Tipo	Predeterminado	Descripción
`query`	string	— (obligatorio)	Tipo de tarea o descripción a coincidir
`input`	object	— (obligatorio)	Entrada del modelo
`maxCost`	string	—	Nivel de precio: `economy`, `standard`, `balanced`, `premium`, `flagship`

Enrutamiento automático

El endpoint de enrutamiento automático clasifica tu prompt y enruta al mejor modelo:

Prompt → Clasificador de contenido → [text, code, image, music, video, speech, web_search]
                              → Detector de modo → [generate, edit, combine]
                                → Selector de modelo → Mejor modelo → Proxy de inferencia → Respuesta

El clasificador analiza tu prompt en varias dimensiones:

Clasificación de tarea — Identifica si trabajas con texto, código, imágenes, música, video, voz o búsqueda web.
Detección de modo — Determina si quieres generar contenido nuevo o editar material existente.
Estimación de complejidad — Asigna un nivel (SIMPLE, MEDIUM, COMPLEX, REASONING) para emparejar la calidad del modelo.
Optimización de costo — Prefiere modelos eficientes cuando los requisitos de capacidad son bajos.

Enrutamiento jerárquico del catálogo

Enruta con mayor especificidad usando selectores de catálogo en /v1/auto/route y /v1/auto/suggest:

Nivel	Parámetros	Comportamiento
Solo taxonomía	`taxonomy: "translation"`	Filtra por categoría y ordena normalmente
Taxonomía + proveedor	`taxonomy: "translation"`, `provider: "meta"`	Mejor modelo Meta en traducción
Familia	`catalog_family: "..."`	Mejor variante enrutable de esa familia
Modelo explícito	`model: "meta/m2m100-1.2b"`	Usa ese modelo directamente

Mejores prácticas

Usa enrutamiento automático por defecto — Deja que GreatRouter clasifique y seleccione el modelo.
Proporciona pistas de tarea cuando sea útil — El parámetro task mejora la precisión para casos ambiguos.
Establece límites de presupuesto — Usa budget_dollars para controlar costos en producción.
Rastrea sesiones — Reutiliza session_id para mejorar la coherencia del contexto.

Para la documentación completa en inglés (tablas de referencia, matrices y ejemplos avanzados), consulta la versión en inglés o continúa explorando las secciones vinculadas en la barra lateral.