Aller au contenu
Commencer
RoutageModèlesFonctionnalitésDocsApps Connexion Commencer

Routage

Le moteur de routage de GreatRouter est l’intelligence centrale qui relie vos prompts au meilleur modèle pour la tâche. GreatRouter propose deux endpoints de routage :

  • Routage automatique (/v1/auto/route) — Décrivez votre besoin en langage naturel. Le routeur classifie l’intention, sélectionne un modèle et transmet la requête.
  • Routage explicite (/v1/models/route) — Spécifiez le type de tâche et les filtres. Le routeur classe les modèles correspondants et transmet la requête.

Paramètres de routage

Paramètres du routage automatique

ParamètreTypePar défautDescription
promptstring(requis)Description en langage naturel de votre besoin
inputobject(requis)Entrée du modèle (messages, paramètres, etc.)
taskstringIndice : text, image, video, music, speech, code, web_search
content_modestringgenerate, edit ou combine
optimizationstring"balanced"price-optimized, output-optimized ou balanced
budget_dollarsnumberCoût estimé maximum en USD

Paramètres du routage explicite

ParamètreTypePar défautDescription
querystring(requis)Type de tâche ou description à faire correspondre
inputobject(requis)Entrée du modèle
maxCoststringNiveau de prix : economy, standard, balanced, premium, flagship

Routage automatique

L’endpoint de routage automatique classifie votre prompt et route vers le meilleur modèle :

Prompt → Classificateur de contenu → [text, code, image, music, video, speech, web_search]
→ Détecteur de mode → [generate, edit, combine]
→ Sélecteur de modèle → Meilleur modèle → Proxy d’inférence → Réponse

Le classificateur analyse votre prompt selon plusieurs dimensions :

  • Classification de tâche — Identifie texte, code, images, musique, vidéo, parole ou recherche web.
  • Détection de mode — Détermine si vous souhaitez générer du contenu ou modifier du contenu existant.
  • Estimation de complexité — Attribue un niveau (SIMPLE, MEDIUM, COMPLEX, REASONING) pour faire correspondre la qualité du modèle.
  • Optimisation des coûts — Préfère les modèles efficaces lorsque les exigences de capacité sont faibles.

Routage hiérarchique du catalogue

Routez avec plus de précision via les sélecteurs de catalogue sur /v1/auto/route et /v1/auto/suggest :

NiveauParamètresComportement
Taxonomie seuletaxonomy: "translation"Filtre par catégorie et classe normalement
Taxonomie + fournisseurtaxonomy: "translation", provider: "meta"Meilleur modèle Meta en traduction
Famillecatalog_family: "..."Meilleure variante routable de cette famille
Modèle explicitemodel: "meta/m2m100-1.2b"Utilise ce modèle directement

Bonnes pratiques

  1. Utilisez le routage automatique par défaut — Laissez GreatRouter classifier et sélectionner le modèle.
  2. Fournissez des indices de tâche si utile — Le paramètre task améliore la précision pour les cas ambigus.
  3. Définissez des limites de budget — Utilisez budget_dollars pour contrôler les coûts en production.
  4. Suivez les sessions — Réutilisez session_id pour améliorer la cohérence du contexte.

Pour la documentation complète en anglais (tableaux de référence, matrices et exemples avancés), consultez la version anglaise ou explorez les sections liées dans la barre latérale.