Routage
Le moteur de routage de GreatRouter est l’intelligence centrale qui relie vos prompts au meilleur modèle pour la tâche. GreatRouter propose deux endpoints de routage :
- Routage automatique (
/v1/auto/route) — Décrivez votre besoin en langage naturel. Le routeur classifie l’intention, sélectionne un modèle et transmet la requête. - Routage explicite (
/v1/models/route) — Spécifiez le type de tâche et les filtres. Le routeur classe les modèles correspondants et transmet la requête.
Paramètres de routage
Paramètres du routage automatique
| Paramètre | Type | Par défaut | Description |
|---|---|---|---|
prompt | string | — (requis) | Description en langage naturel de votre besoin |
input | object | — (requis) | Entrée du modèle (messages, paramètres, etc.) |
task | string | — | Indice : text, image, video, music, speech, code, web_search |
content_mode | string | — | generate, edit ou combine |
optimization | string | "balanced" | price-optimized, output-optimized ou balanced |
budget_dollars | number | — | Coût estimé maximum en USD |
Paramètres du routage explicite
| Paramètre | Type | Par défaut | Description |
|---|---|---|---|
query | string | — (requis) | Type de tâche ou description à faire correspondre |
input | object | — (requis) | Entrée du modèle |
maxCost | string | — | Niveau de prix : economy, standard, balanced, premium, flagship |
Routage automatique
L’endpoint de routage automatique classifie votre prompt et route vers le meilleur modèle :
Prompt → Classificateur de contenu → [text, code, image, music, video, speech, web_search] → Détecteur de mode → [generate, edit, combine] → Sélecteur de modèle → Meilleur modèle → Proxy d’inférence → RéponseLe classificateur analyse votre prompt selon plusieurs dimensions :
- Classification de tâche — Identifie texte, code, images, musique, vidéo, parole ou recherche web.
- Détection de mode — Détermine si vous souhaitez générer du contenu ou modifier du contenu existant.
- Estimation de complexité — Attribue un niveau (
SIMPLE,MEDIUM,COMPLEX,REASONING) pour faire correspondre la qualité du modèle. - Optimisation des coûts — Préfère les modèles efficaces lorsque les exigences de capacité sont faibles.
Routage hiérarchique du catalogue
Routez avec plus de précision via les sélecteurs de catalogue sur /v1/auto/route et /v1/auto/suggest :
| Niveau | Paramètres | Comportement |
|---|---|---|
| Taxonomie seule | taxonomy: "translation" | Filtre par catégorie et classe normalement |
| Taxonomie + fournisseur | taxonomy: "translation", provider: "meta" | Meilleur modèle Meta en traduction |
| Famille | catalog_family: "..." | Meilleure variante routable de cette famille |
| Modèle explicite | model: "meta/m2m100-1.2b" | Utilise ce modèle directement |
Bonnes pratiques
- Utilisez le routage automatique par défaut — Laissez GreatRouter classifier et sélectionner le modèle.
- Fournissez des indices de tâche si utile — Le paramètre
taskaméliore la précision pour les cas ambigus. - Définissez des limites de budget — Utilisez
budget_dollarspour contrôler les coûts en production. - Suivez les sessions — Réutilisez
session_idpour améliorer la cohérence du contexte.
Pour la documentation complète en anglais (tableaux de référence, matrices et exemples avancés), consultez la version anglaise ou explorez les sections liées dans la barre latérale.