OpenHuman 指南

← 返回教程列表

OpenHuman 模型路由原理详解 — 自动分配推理/快速/视觉模型

OpenHuman 的一大特色是自动模型路由。你不需要手动选择用哪个模型——系统会根据当前任务类型自动分配到最合适的模型。

🎯 为什么需要模型路由？

不同的 AI 任务对模型的要求不同：

代码审查 / 深度分析： 需要推理能力强的模型（如 DeepSeek-V3、GPT-4o）
日常对话 / 简单查询： 用快速便宜的模型就够了（如 GPT-4o-mini）
图片分析： 需要多模态视觉模型

没有路由机制，你要么一直用贵模型（浪费钱），要么用便宜模型做不了复杂任务。OpenHuman 的解决方案是：自动识别任务类型，分配最合适的模型。

⚙️ 三种路由类别

🧠 Reasoning

推理模型
适合：深度分析、代码审查、复杂推理、长文摘要

⚡ Fast

快速模型
适合：日常对话、简单查询、快速生成

👁️ Vision

视觉模型
适合：图片分析、截图理解、文档 OCR

在对话中，你可以通过 hint 手动指定路由选择：

hint:reasoning — 强制使用推理模型
hint:fast — 强制使用快速模型
hint:vision — 强制使用视觉模型

🔄 路由决策过程

当你向 OpenHuman 发送一条请求时，路由决策大概是这样的：

分析请求： 系统判断请求类型——是复杂推理还是简单对话？有没有图片需要分析？
匹配路由： 根据分析结果，选择对应路线的模型
执行任务： 用选定的模型处理请求
结果传递： 处理结果通过 TokenJuice 压缩后返回给 UI

整个过程对用户透明——你只需要发一条消息，背后自会分配最优模型。

🏠 本地 AI 回退

默认情况下，模型路由使用 OpenHuman 托管后端（一个订阅包含所有模型）。但你也可以配置 本地 AI：

通过 Ollama 或 LM Studio 运行本地模型
本地模型优先处理低敏感度任务（如总结、分类）
路由系统会自动将高效的工作负载导向本地模型，复杂任务仍走云端
混合模式：本地模型处理大部分日常任务，前端模型处理需要高推理能力的任务

💳 订阅与模型

一个 OpenHuman 订阅包含对所有路由模型的使用权限：

推理模型：DeepSeek-V3、GPT-4o 等高阶模型
快速模型：GPT-4o-mini 等低成本模型
视觉模型：GPT-4o vision 等多模态模型
总共涵盖 30+ 提供商

也可以配置自有 API Key，手动指定使用的模型。详情见 API Key 配置。

📊 模型路由 vs 手动选择

对比项	自动模型路由	手动选择
便利性	✅ 无需操心	每次需要手动切
成本控制	✅ 自动用便宜模型做简单任务	容易一直用贵模型
灵活度	自动决策	✅ 完全控制
推荐	✅ 大多数场景	开发者/调优场景