Enrutamiento
El motor de enrutamiento de GreatRouter es la inteligencia central que conecta tus prompts con el mejor modelo para la tarea. GreatRouter ofrece dos endpoints de enrutamiento:
- Enrutamiento automático (
/v1/auto/route) — Describe lo que necesitas en lenguaje natural. El router clasifica la intención, selecciona un modelo y envía la solicitud. - Enrutamiento explícito (
/v1/models/route) — Especifica el tipo de tarea y los filtros. El router ordena los modelos coincidentes y envía la solicitud.
Parámetros de enrutamiento
Parámetros de enrutamiento automático
| Parámetro | Tipo | Predeterminado | Descripción |
|---|---|---|---|
prompt | string | — (obligatorio) | Descripción en lenguaje natural de lo que necesitas |
input | object | — (obligatorio) | Entrada del modelo (mensajes, parámetros, etc.) |
task | string | — | Pista: text, image, video, music, speech, code, web_search |
content_mode | string | — | generate, edit o combine |
optimization | string | "balanced" | price-optimized, output-optimized o balanced |
budget_dollars | number | — | Costo máximo estimado en USD |
Parámetros de enrutamiento explícito
| Parámetro | Tipo | Predeterminado | Descripción |
|---|---|---|---|
query | string | — (obligatorio) | Tipo de tarea o descripción a coincidir |
input | object | — (obligatorio) | Entrada del modelo |
maxCost | string | — | Nivel de precio: economy, standard, balanced, premium, flagship |
Enrutamiento automático
El endpoint de enrutamiento automático clasifica tu prompt y enruta al mejor modelo:
Prompt → Clasificador de contenido → [text, code, image, music, video, speech, web_search] → Detector de modo → [generate, edit, combine] → Selector de modelo → Mejor modelo → Proxy de inferencia → RespuestaEl clasificador analiza tu prompt en varias dimensiones:
- Clasificación de tarea — Identifica si trabajas con texto, código, imágenes, música, video, voz o búsqueda web.
- Detección de modo — Determina si quieres generar contenido nuevo o editar material existente.
- Estimación de complejidad — Asigna un nivel (
SIMPLE,MEDIUM,COMPLEX,REASONING) para emparejar la calidad del modelo. - Optimización de costo — Prefiere modelos eficientes cuando los requisitos de capacidad son bajos.
Enrutamiento jerárquico del catálogo
Enruta con mayor especificidad usando selectores de catálogo en /v1/auto/route y /v1/auto/suggest:
| Nivel | Parámetros | Comportamiento |
|---|---|---|
| Solo taxonomía | taxonomy: "translation" | Filtra por categoría y ordena normalmente |
| Taxonomía + proveedor | taxonomy: "translation", provider: "meta" | Mejor modelo Meta en traducción |
| Familia | catalog_family: "..." | Mejor variante enrutable de esa familia |
| Modelo explícito | model: "meta/m2m100-1.2b" | Usa ese modelo directamente |
Mejores prácticas
- Usa enrutamiento automático por defecto — Deja que GreatRouter clasifique y seleccione el modelo.
- Proporciona pistas de tarea cuando sea útil — El parámetro
taskmejora la precisión para casos ambiguos. - Establece límites de presupuesto — Usa
budget_dollarspara controlar costos en producción. - Rastrea sesiones — Reutiliza
session_idpara mejorar la coherencia del contexto.
Para la documentación completa en inglés (tablas de referencia, matrices y ejemplos avanzados), consulta la versión en inglés o continúa explorando las secciones vinculadas en la barra lateral.