Roteamento
O motor de roteamento do GreatRouter é a inteligência central que conecta seus prompts ao melhor modelo para a tarefa. O GreatRouter oferece dois endpoints de roteamento:
- Roteamento automático (
/v1/auto/route) — Descreva o que você precisa em linguagem natural. O roteador classifica a intenção, seleciona um modelo e encaminha a solicitação. - Roteamento explícito (
/v1/models/route) — Especifique o tipo de tarefa e os filtros. O roteador ordena os modelos correspondentes e encaminha a solicitação.
Parâmetros de roteamento
Parâmetros do roteamento automático
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
prompt | string | — (obrigatório) | Descrição em linguagem natural do que você precisa |
input | object | — (obrigatório) | Entrada do modelo (mensagens, parâmetros, etc.) |
task | string | — | Dica: text, image, video, music, speech, code, web_search |
content_mode | string | — | generate, edit ou combine |
optimization | string | "balanced" | price-optimized, output-optimized ou balanced |
budget_dollars | number | — | Custo máximo estimado em USD |
Parâmetros do roteamento explícito
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
query | string | — (obrigatório) | Tipo de tarefa ou descrição para correspondência |
input | object | — (obrigatório) | Entrada do modelo |
maxCost | string | — | Nível de preço: economy, standard, balanced, premium, flagship |
Roteamento automático
O endpoint de roteamento automático classifica seu prompt e roteia para o melhor modelo:
Prompt → Classificador de conteúdo → [text, code, image, music, video, speech, web_search] → Detector de modo → [generate, edit, combine] → Seletor de modelo → Melhor modelo → Proxy de inferência → RespostaO classificador analisa seu prompt em várias dimensões:
- Classificação de tarefa — Identifica se você trabalha com texto, código, imagens, música, vídeo, fala ou pesquisa na web.
- Detecção de modo — Determina se você quer gerar conteúdo novo ou editar material existente.
- Estimativa de complexidade — Atribui um nível (
SIMPLE,MEDIUM,COMPLEX,REASONING) para corresponder à qualidade do modelo. - Otimização de custo — Prefere modelos eficientes quando os requisitos de capacidade são baixos.
Roteamento hierárquico do catálogo
Roteie com mais especificidade usando seletores de catálogo em /v1/auto/route e /v1/auto/suggest:
| Nível | Parâmetros | Comportamento |
|---|---|---|
| Somente taxonomia | taxonomy: "translation" | Filtra por categoria e ordena normalmente |
| Taxonomia + provedor | taxonomy: "translation", provider: "meta" | Melhor modelo Meta em tradução |
| Família | catalog_family: "..." | Melhor variante roteável dessa família |
| Modelo explícito | model: "meta/m2m100-1.2b" | Usa esse modelo diretamente |
Melhores práticas
- Use roteamento automático por padrão — Deixe o GreatRouter classificar e selecionar o modelo.
- Forneça dicas de tarefa quando útil — O parâmetro
taskmelhora a precisão para casos ambíguos. - Defina limites de orçamento — Use
budget_dollarspara controlar custos em produção. - Rastreie sessões — Reutilize
session_idpara melhorar a consistência do contexto.
Para a documentação completa em inglês (tabelas de referência, matrizes e exemplos avançados), consulte a versão em inglês ou continue explorando as seções vinculadas na barra lateral.