Saltearse al contenido
Comenzar
EnrutamientoModelosFuncionesDocsApps Iniciar sesión Comenzar

Enrutamiento

El motor de enrutamiento de GreatRouter es la inteligencia central que conecta tus prompts con el mejor modelo para la tarea. GreatRouter ofrece dos endpoints de enrutamiento:

  • Enrutamiento automático (/v1/auto/route) — Describe lo que necesitas en lenguaje natural. El router clasifica la intención, selecciona un modelo y envía la solicitud.
  • Enrutamiento explícito (/v1/models/route) — Especifica el tipo de tarea y los filtros. El router ordena los modelos coincidentes y envía la solicitud.

Parámetros de enrutamiento

Parámetros de enrutamiento automático

ParámetroTipoPredeterminadoDescripción
promptstring(obligatorio)Descripción en lenguaje natural de lo que necesitas
inputobject(obligatorio)Entrada del modelo (mensajes, parámetros, etc.)
taskstringPista: text, image, video, music, speech, code, web_search
content_modestringgenerate, edit o combine
optimizationstring"balanced"price-optimized, output-optimized o balanced
budget_dollarsnumberCosto máximo estimado en USD

Parámetros de enrutamiento explícito

ParámetroTipoPredeterminadoDescripción
querystring(obligatorio)Tipo de tarea o descripción a coincidir
inputobject(obligatorio)Entrada del modelo
maxCoststringNivel de precio: economy, standard, balanced, premium, flagship

Enrutamiento automático

El endpoint de enrutamiento automático clasifica tu prompt y enruta al mejor modelo:

Prompt → Clasificador de contenido → [text, code, image, music, video, speech, web_search]
→ Detector de modo → [generate, edit, combine]
→ Selector de modelo → Mejor modelo → Proxy de inferencia → Respuesta

El clasificador analiza tu prompt en varias dimensiones:

  • Clasificación de tarea — Identifica si trabajas con texto, código, imágenes, música, video, voz o búsqueda web.
  • Detección de modo — Determina si quieres generar contenido nuevo o editar material existente.
  • Estimación de complejidad — Asigna un nivel (SIMPLE, MEDIUM, COMPLEX, REASONING) para emparejar la calidad del modelo.
  • Optimización de costo — Prefiere modelos eficientes cuando los requisitos de capacidad son bajos.

Enruta con mayor especificidad usando selectores de catálogo en /v1/auto/route y /v1/auto/suggest:

NivelParámetrosComportamiento
Solo taxonomíataxonomy: "translation"Filtra por categoría y ordena normalmente
Taxonomía + proveedortaxonomy: "translation", provider: "meta"Mejor modelo Meta en traducción
Familiacatalog_family: "..."Mejor variante enrutable de esa familia
Modelo explícitomodel: "meta/m2m100-1.2b"Usa ese modelo directamente

Mejores prácticas

  1. Usa enrutamiento automático por defecto — Deja que GreatRouter clasifique y seleccione el modelo.
  2. Proporciona pistas de tarea cuando sea útil — El parámetro task mejora la precisión para casos ambiguos.
  3. Establece límites de presupuesto — Usa budget_dollars para controlar costos en producción.
  4. Rastrea sesiones — Reutiliza session_id para mejorar la coherencia del contexto.

Para la documentación completa en inglés (tablas de referencia, matrices y ejemplos avanzados), consulta la versión en inglés o continúa explorando las secciones vinculadas en la barra lateral.