OpenHuman 指南
← 返回教程列表

OpenHuman 模型路由原理详解 — 自动分配推理/快速/视觉模型

OpenHuman 的一大特色是自动模型路由。你不需要手动选择用哪个模型——系统会根据当前任务类型自动分配到最合适的模型。

🎯 为什么需要模型路由?

不同的 AI 任务对模型的要求不同:

  • 代码审查 / 深度分析: 需要推理能力强的模型(如 DeepSeek-V3、GPT-4o)
  • 日常对话 / 简单查询: 用快速便宜的模型就够了(如 GPT-4o-mini)
  • 图片分析: 需要多模态视觉模型

没有路由机制,你要么一直用贵模型(浪费钱),要么用便宜模型做不了复杂任务。OpenHuman 的解决方案是:自动识别任务类型,分配最合适的模型。

⚙️ 三种路由类别

🧠 Reasoning

推理模型
适合:深度分析、代码审查、复杂推理、长文摘要

⚡ Fast

快速模型
适合:日常对话、简单查询、快速生成

👁️ Vision

视觉模型
适合:图片分析、截图理解、文档 OCR

在对话中,你可以通过 hint 手动指定路由选择:

  • hint:reasoning — 强制使用推理模型
  • hint:fast — 强制使用快速模型
  • hint:vision — 强制使用视觉模型

🔄 路由决策过程

当你向 OpenHuman 发送一条请求时,路由决策大概是这样的:

  1. 分析请求: 系统判断请求类型——是复杂推理还是简单对话?有没有图片需要分析?
  2. 匹配路由: 根据分析结果,选择对应路线的模型
  3. 执行任务: 用选定的模型处理请求
  4. 结果传递: 处理结果通过 TokenJuice 压缩后返回给 UI

整个过程对用户透明——你只需要发一条消息,背后自会分配最优模型。

🏠 本地 AI 回退

默认情况下,模型路由使用 OpenHuman 托管后端(一个订阅包含所有模型)。但你也可以配置 本地 AI

  • 通过 Ollama 或 LM Studio 运行本地模型
  • 本地模型优先处理低敏感度任务(如总结、分类)
  • 路由系统会自动将高效的工作负载导向本地模型,复杂任务仍走云端
  • 混合模式:本地模型处理大部分日常任务,前端模型处理需要高推理能力的任务

💳 订阅与模型

一个 OpenHuman 订阅包含对所有路由模型的使用权限:

  • 推理模型:DeepSeek-V3、GPT-4o 等高阶模型
  • 快速模型:GPT-4o-mini 等低成本模型
  • 视觉模型:GPT-4o vision 等多模态模型
  • 总共涵盖 30+ 提供商

也可以配置自有 API Key,手动指定使用的模型。详情见 API Key 配置

📊 模型路由 vs 手动选择

对比项自动模型路由手动选择
便利性✅ 无需操心每次需要手动切
成本控制✅ 自动用便宜模型做简单任务容易一直用贵模型
灵活度自动决策✅ 完全控制
推荐✅ 大多数场景开发者/调优场景