路由
GreatRouter 的路由引擎是将您的提示连接到任务最佳模型的核心智能。GreatRouter 提供两个路由端点:
- 自动路由 (
/v1/auto/route) — 用自然语言描述您的需求。路由器分类意图、选择模型并转发请求。 - 显式路由 (
/v1/models/route) — 指定任务类型和筛选条件。路由器对匹配的模型排序并转发请求。
路由参数
自动路由参数
| 参数 | 类型 | 默认值 | 描述 |
|---|---|---|---|
prompt | string | — (必填) | 自然语言描述您的需求 |
input | object | — (必填) | 模型输入(消息、参数等) |
task | string | — | 提示:text、image、video、music、speech、code、web_search |
content_mode | string | — | generate、edit 或 combine |
optimization | string | "balanced" | price-optimized、output-optimized 或 balanced |
budget_dollars | number | — | 最大预估成本(美元) |
显式路由参数
| 参数 | 类型 | 默认值 | 描述 |
|---|---|---|---|
query | string | — (必填) | 要匹配的任务类型或描述 |
input | object | — (必填) | 模型输入 |
maxCost | string | — | 价格层级:economy、standard、balanced、premium、flagship |
自动路由
自动路由端点分类您的提示并路由至最佳模型:
提示 → 内容分类器 → [text, code, image, music, video, speech, web_search] → 模式检测器 → [generate, edit, combine] → 模型选择器 → 最佳模型 → 推理代理 → 响应分类器从多个维度分析您的提示:
- 任务分类 — 识别您处理的是文本、代码、图像、音乐、视频、语音还是网络搜索。
- 模式检测 — 确定您是要生成新内容还是编辑现有内容。
- 复杂度估算 — 分配级别(
SIMPLE、MEDIUM、COMPLEX、REASONING)以匹配模型质量。 - 成本优化 — 当能力要求较低时优先选择高效模型。
目录分层路由
在 /v1/auto/route 和 /v1/auto/suggest 上使用目录选择器实现更精确的路由:
| 层级 | 参数 | 行为 |
|---|---|---|
| 仅分类 | taxonomy: "translation" | 按类别筛选并正常排序 |
| 分类 + 提供商 | taxonomy: "translation", provider: "meta" | 翻译类别中最佳 Meta 模型 |
| 系列 | catalog_family: "..." | 该系列中最佳可路由变体 |
| 显式模型 | model: "meta/m2m100-1.2b" | 直接使用该模型 |
最佳实践
- 默认使用自动路由 — 让 GreatRouter 分类并选择模型。
- 在有用时提供任务提示 —
task参数可提高模糊情况的准确性。 - 设置预算限制 — 在生产环境中使用
budget_dollars控制成本。 - 跟踪会话 — 复用
session_id以提高上下文一致性。
有关完整英文文档(参考表、矩阵和高级示例),请参阅英文版或继续浏览侧边栏中的链接部分。