Pular para o conteúdo
Começar
Como funcionaModelosRecursosDocsStudios Entrar Começar

Roteamento

O motor de roteamento do GreatRouter é a inteligência central que conecta seus prompts ao melhor modelo para a tarefa. O GreatRouter oferece dois endpoints de roteamento:

  • Roteamento automático (/v1/auto/route) — Descreva o que você precisa em linguagem natural. O roteador classifica a intenção, seleciona um modelo e encaminha a solicitação.
  • Roteamento explícito (/v1/models/route) — Especifique o tipo de tarefa e os filtros. O roteador ordena os modelos correspondentes e encaminha a solicitação.

Parâmetros de roteamento

Parâmetros do roteamento automático

ParâmetroTipoPadrãoDescrição
promptstring(obrigatório)Descrição em linguagem natural do que você precisa
inputobject(obrigatório)Entrada do modelo (mensagens, parâmetros, etc.)
taskstringDica: text, image, video, music, speech, code, web_search
content_modestringgenerate, edit ou combine
optimizationstring"balanced"price-optimized, output-optimized ou balanced
budget_dollarsnumberCusto máximo estimado em USD

Parâmetros do roteamento explícito

ParâmetroTipoPadrãoDescrição
querystring(obrigatório)Tipo de tarefa ou descrição para correspondência
inputobject(obrigatório)Entrada do modelo
maxCoststringNível de preço: economy, standard, balanced, premium, flagship

Roteamento automático

O endpoint de roteamento automático classifica seu prompt e roteia para o melhor modelo:

Prompt → Classificador de conteúdo → [text, code, image, music, video, speech, web_search]
→ Detector de modo → [generate, edit, combine]
→ Seletor de modelo → Melhor modelo → Proxy de inferência → Resposta

O classificador analisa seu prompt em várias dimensões:

  • Classificação de tarefa — Identifica se você trabalha com texto, código, imagens, música, vídeo, fala ou pesquisa na web.
  • Detecção de modo — Determina se você quer gerar conteúdo novo ou editar material existente.
  • Estimativa de complexidade — Atribui um nível (SIMPLE, MEDIUM, COMPLEX, REASONING) para corresponder à qualidade do modelo.
  • Otimização de custo — Prefere modelos eficientes quando os requisitos de capacidade são baixos.

Roteie com mais especificidade usando seletores de catálogo em /v1/auto/route e /v1/auto/suggest:

NívelParâmetrosComportamento
Somente taxonomiataxonomy: "translation"Filtra por categoria e ordena normalmente
Taxonomia + provedortaxonomy: "translation", provider: "meta"Melhor modelo Meta em tradução
Famíliacatalog_family: "..."Melhor variante roteável dessa família
Modelo explícitomodel: "meta/m2m100-1.2b"Usa esse modelo diretamente

Melhores práticas

  1. Use roteamento automático por padrão — Deixe o GreatRouter classificar e selecionar o modelo.
  2. Forneça dicas de tarefa quando útil — O parâmetro task melhora a precisão para casos ambíguos.
  3. Defina limites de orçamento — Use budget_dollars para controlar custos em produção.
  4. Rastreie sessões — Reutilize session_id para melhorar a consistência do contexto.

Para a documentação completa em inglês (tabelas de referência, matrizes e exemplos avançados), consulte a versão em inglês ou continue explorando as seções vinculadas na barra lateral.