← 返回教程列表
OpenHuman 模型路由原理详解 — 自动分配推理/快速/视觉模型
OpenHuman 的一大特色是自动模型路由。你不需要手动选择用哪个模型——系统会根据当前任务类型自动分配到最合适的模型。
🎯 为什么需要模型路由?
不同的 AI 任务对模型的要求不同:
- 代码审查 / 深度分析: 需要推理能力强的模型(如 DeepSeek-V3、GPT-4o)
- 日常对话 / 简单查询: 用快速便宜的模型就够了(如 GPT-4o-mini)
- 图片分析: 需要多模态视觉模型
没有路由机制,你要么一直用贵模型(浪费钱),要么用便宜模型做不了复杂任务。OpenHuman 的解决方案是:自动识别任务类型,分配最合适的模型。
⚙️ 三种路由类别
🧠 Reasoning
推理模型
适合:深度分析、代码审查、复杂推理、长文摘要
⚡ Fast
快速模型
适合:日常对话、简单查询、快速生成
👁️ Vision
视觉模型
适合:图片分析、截图理解、文档 OCR
在对话中,你可以通过 hint 手动指定路由选择:
hint:reasoning— 强制使用推理模型hint:fast— 强制使用快速模型hint:vision— 强制使用视觉模型
🔄 路由决策过程
当你向 OpenHuman 发送一条请求时,路由决策大概是这样的:
- 分析请求: 系统判断请求类型——是复杂推理还是简单对话?有没有图片需要分析?
- 匹配路由: 根据分析结果,选择对应路线的模型
- 执行任务: 用选定的模型处理请求
- 结果传递: 处理结果通过 TokenJuice 压缩后返回给 UI
整个过程对用户透明——你只需要发一条消息,背后自会分配最优模型。
🏠 本地 AI 回退
默认情况下,模型路由使用 OpenHuman 托管后端(一个订阅包含所有模型)。但你也可以配置 本地 AI:
- 通过 Ollama 或 LM Studio 运行本地模型
- 本地模型优先处理低敏感度任务(如总结、分类)
- 路由系统会自动将高效的工作负载导向本地模型,复杂任务仍走云端
- 混合模式:本地模型处理大部分日常任务,前端模型处理需要高推理能力的任务
💳 订阅与模型
一个 OpenHuman 订阅包含对所有路由模型的使用权限:
- 推理模型:DeepSeek-V3、GPT-4o 等高阶模型
- 快速模型:GPT-4o-mini 等低成本模型
- 视觉模型:GPT-4o vision 等多模态模型
- 总共涵盖 30+ 提供商
也可以配置自有 API Key,手动指定使用的模型。详情见 API Key 配置。
📊 模型路由 vs 手动选择
| 对比项 | 自动模型路由 | 手动选择 |
|---|---|---|
| 便利性 | ✅ 无需操心 | 每次需要手动切 |
| 成本控制 | ✅ 自动用便宜模型做简单任务 | 容易一直用贵模型 |
| 灵活度 | 自动决策 | ✅ 完全控制 |
| 推荐 | ✅ 大多数场景 | 开发者/调优场景 |