功能详解
OpenHuman TokenJuice 详解 — 如何降低 80% Token 消耗
2026-05-24约 8 分钟阅读
TokenJuice 是 OpenHuman 内置的智能 Token 压缩引擎。它可以将工具输出和上下文压缩后送入大模型,降低最高 80% 的 Token 消耗。这意味着你的 API 费用直接降至原来的 1/5。
为什么需要 TokenJuice?
AI Agent 环境中一个被忽视的问题:Token 消耗的大头不是对话消息,而是工具返回的结构化数据。当 OpenHuman 调用 Gmail API 获取邮件列表时,原始 JSON 响应可能有几千到几万 Token。如果不压缩,调用一个工具的成本甚至可能超过模型输出的成本。
TokenJuice 的工作原理
- 捕获原始输出:截获第三方工具返回的原始数据(JSON/HTML/文本)
- 智能压缩:提取关键信息,去除冗余字段,生成结构化摘要
- 格式化输出:将摘要转换为≤3k token 的 Markdown 格式
- 送入 LLM:压缩后的上下文进入模型推理
TokenJuice 压缩效果
| 数据源 | 原始大小 | 压缩后 | 压缩率 |
|---|---|---|---|
| Gmail 收件箱(50 封) | ~15,000 tokens | ~2,500 tokens | 83% |
| GitHub PR 列表(20 个) | ~8,000 tokens | ~1,500 tokens | 81% |
| Notion 页面 | ~5,000 tokens | ~1,200 tokens | 76% |
| Slack 消息历史 | ~12,000 tokens | ~2,000 tokens | 83% |
| Web 页面抓取 | ~20,000 tokens | ~3,000 tokens | 85% |
费用节省测算
假设你每天用 OpenHuman 处理 500 次工具调用,每次压缩省 5,000 tokens:
- 无 TokenJuice:2,500,000 tokens/天 ≈ $3.75(GPT-4o-mini)
- 有 TokenJuice:500,000 tokens/天 ≈ $0.75
- 每月省钱:约 $90(DeepSeek 模型的话更多)
如何开启 TokenJuice
TokenJuice 默认开启,无需手动配置。但你可以调整压缩级别:
[token_juice]
enabled = true
compression_level = "aggressive" # 可选: mild, balanced, aggressive
max_chunk_tokens = 3000
preserve_structure = true参数说明
- enabled:是否启用
- compression_level:压缩级别,推荐 balanced 或 aggressive
- max_chunk_tokens:压缩块上限
- preserve_structure:是否保留 JSON 结构
注意事项
- 信息损失:压缩必然有取舍,aggressive 模式会丢失部分细节
- 结构数据:preserve_structure=true 适合需要精确字段的查询
- 调试时建议用 mild:排查问题时先降低压缩级别
总结
TokenJuice 是 OpenHuman 相比其他 AI Agent 的杀手级功能。默认开启即用,每月帮你省下可观的 API 费用。如果你的模型是自备 Key(BYOK),建议保持 TokenJuice 默认配置,效果已经很好了。