Premiers pas
Ce guide vous accompagne pour votre première inférence avec l’API GreatRouter.
1. Obtenir votre clé API
Inscrivez-vous sur le tableau de bord GreatRouter pour obtenir votre clé API. Chaque nouveau compte inclut des crédits gratuits.
Définissez la variable d’environnement :
export GREAT_ROUTER_API_KEY="pk_live_..."2. Faire votre première requête
GreatRouter utilise l’endpoint /v1/auto/route pour le routage automatique des prompts. Envoyez votre prompt et l’entrée du modèle ; le routeur sélectionne le meilleur modèle.
Avec curl
curl https://api.greatrouterai.com/v1/auto/route \ -H "Authorization: Bearer $GREAT_ROUTER_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "prompt": "Quelle est la capitale de la France ?", "input": { "messages": [{"role": "user", "content": "Quelle est la capitale de la France ?"}] } }'Avec Python
import requests
response = requests.post( "https://api.greatrouterai.com/v1/auto/route", headers={ "Authorization": f"Bearer {api_key}", "Content-Type": "application/json", }, json={ "prompt": "Quelle est la capitale de la France ?", "input": { "messages": [{"role": "user", "content": "Quelle est la capitale de la France ?"}] }, },)
result = response.json()print(result["result"]["choices"][0]["message"]["content"])Avec Node.js
const response = await fetch('https://api.greatrouterai.com/v1/auto/route', { method: 'POST', headers: { 'Authorization': `Bearer ${process.env.GREAT_ROUTER_API_KEY}`, 'Content-Type': 'application/json', }, body: JSON.stringify({ prompt: 'Quelle est la capitale de la France ?', input: { messages: [{ role: 'user', content: 'Quelle est la capitale de la France ?' }], }, }),});
const result = await response.json();console.log(result.result.choices[0].message.content);3. Spécifier un modèle directement
Pour cibler un modèle précis plutôt que le routage automatique, utilisez /v1/models/route avec une requête explicite :
curl https://api.greatrouterai.com/v1/models/route \ -H "Authorization: Bearer $GREAT_ROUTER_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "query": "text_generation", "input": { "model": "meta/llama-3.3-70b-instruct-fp8-fast", "messages": [{"role": "user", "content": "Expliquez l’informatique quantique en 3 phrases."}] } }'Les identifiants de modèle suivent le format fournisseur/nom-modele. Parcourez tous les modèles sur Modèles.
4. Aller plus loin
- Démarrage rapide — plus d’exemples, dont la génération d’images et le routage avec limite de coût
- Référence API — documentation complète des endpoints
- Modèles — parcourir tous les modèles disponibles
- Modèles et tarifs — catalogue et tarification