रूटिंग
GreatRouter का रूटिंग इंजन वह केंद्रीय बुद्धिमत्ता है जो आपके प्रॉम्प्ट को कार्य के लिए सर्वोत्तम मॉडल से जोड़ती है। GreatRouter दो रूटिंग एंडपॉइंट प्रदान करता है:
- स्वचालित रूटिंग (
/v1/auto/route) — अपनी ज़रूरत साधारण भाषा में बताएँ। राउटर इरादे को वर्गीकृत करता है, मॉडल चुनता है और अनुरोध अग्रेषित करता है। - स्पष्ट रूटिंग (
/v1/models/route) — कार्य प्रकार और फ़िल्टर निर्दिष्ट करें। राउटर मेल खाते मॉडल क्रमबद्ध करता है और अनुरोध अग्रेषित करता है।
रूटिंग पैरामीटर
स्वचालित रूटिंग पैरामीटर
| पैरामीटर | प्रकार | डिफ़ॉल्ट | विवरण |
|---|---|---|---|
prompt | string | — (आवश्यक) | आपकी ज़रूरत का प्राकृतिक भाषा विवरण |
input | object | — (आवश्यक) | मॉडल इनपुट (संदेश, पैरामीटर, आदि) |
task | string | — | संकेत: text, image, video, music, speech, code, web_search |
content_mode | string | — | generate, edit या combine |
optimization | string | "balanced" | price-optimized, output-optimized या balanced |
budget_dollars | number | — | अधिकतम अनुमानित लागत USD में |
स्पष्ट रूटिंग पैरामीटर
| पैरामीटर | प्रकार | डिफ़ॉल्ट | विवरण |
|---|---|---|---|
query | string | — (आवश्यक) | मिलान के लिए कार्य प्रकार या विवरण |
input | object | — (आवश्यक) | मॉडल इनपुट |
maxCost | string | — | मूल्य स्तर: economy, standard, balanced, premium, flagship |
स्वचालित रूटिंग
स्वचालित रूटिंग एंडपॉइंट आपके प्रॉम्प्ट को वर्गीकृत करता है और सर्वोत्तम मॉडल तक रूट करता है:
प्रॉम्प्ट → सामग्री वर्गीकरण → [text, code, image, music, video, speech, web_search] → मोड डिटेक्टर → [generate, edit, combine] → मॉडल चयनकर्ता → सर्वोत्तम मॉडल → इनफ़रेंस प्रॉक्सी → प्रतिक्रियावर्गीकरणकर्ता आपके प्रॉम्प्ट का कई आयामों में विश्लेषण करता है:
- कार्य वर्गीकरण — पहचानता है कि आप टेक्स्ट, कोड, इमेज, संगीत, वीडियो, भाषण या वेब खोज के साथ काम कर रहे हैं।
- मोड पहचान — निर्धारित करता है कि आप नई सामग्री बनाना चाहते हैं या मौजूदा सामग्री संपादित करना।
- जटिलता अनुमान — मॉडल गुणवत्ता से मिलान के लिए स्तर (
SIMPLE,MEDIUM,COMPLEX,REASONING) निर्दिष्ट करता है। - लागत अनुकूलन — कम क्षमता आवश्यकताओं पर कुशल मॉडल प्राथमिकता देता है।
कैटलॉग पदानुक्रमित रूटिंग
/v1/auto/route और /v1/auto/suggest पर कैटलॉग चयनकर्ताओं से अधिक विशिष्टता से रूट करें:
| स्तर | पैरामीटर | व्यवहार |
|---|---|---|
| केवल वर्गीकरण | taxonomy: "translation" | श्रेणी से फ़िल्टर और सामान्य क्रमबद्धता |
| वर्गीकरण + प्रदाता | taxonomy: "translation", provider: "meta" | अनुवाद में सर्वोत्तम Meta मॉडल |
| परिवार | catalog_family: "..." | उस परिवार का सर्वोत्तम रूट करने योग्य वेरिएंट |
| स्पष्ट मॉडल | model: "meta/m2m100-1.2b" | सीधे उस मॉडल का उपयोग |
सर्वोत्तम अभ्यास
- डिफ़ॉल्ट रूप से स्वचालित रूटिंग का उपयोग करें — GreatRouter को वर्गीकृत और मॉडल चुनने दें।
- उपयोगी होने पर कार्य संकेत दें —
taskपैरामीटर अस्पष्ट मामलों में सटीकता बढ़ाता है। - बजट सीमा सेट करें — प्रोडक्शन में लागत नियंत्रण के लिए
budget_dollarsका उपयोग करें। - सत्र ट्रैक करें — संदर्भ स्थिरता के लिए
session_idका पुनः उपयोग करें।
पूर्ण अंग्रेज़ी दस्तावेज़ (संदर्भ तालिकाएँ, मैट्रिक्स और उन्नत उदाहरण) के लिए अंग्रेज़ी संस्करण देखें या साइडबार में लिंक किए गए अनुभागों का अन्वेषण जारी रखें।