上下文窗口与压缩
每个模型都有上下文窗口(可见最大 token 数)。长时间聊天会累积消息与工具结果;窗口紧张时,Moltbot 压缩旧历史以保持在限制内。
何为压缩
压缩将旧对话摘要为紧凑的摘要条目,并保持最近消息完整。摘要存储在会话历史中,后续请求使用:
- 压缩摘要
- 压缩点之后的最近消息
压缩持久化在会话的 JSONL 历史中。
配置
agents.defaults.compaction 设置的压缩配置与模式见 英文压缩文档。
自动压缩(默认开启)
会话接近或超出模型上下文窗口时,Moltbot 触发自动压缩并可能用压缩后的上下文重试原始请求。你会看到:
- 详细模式下的
🧹 Auto-compaction complete /status显示🧹 Compactions: <count>
压缩前,Moltbot 可运行静默内存刷新轮次以将持久笔记存储到磁盘。详情与配置见 Memory。
手动压缩
使用 /compact(可选带说明)强制压缩:
/compact Focus on decisions and open questions上下文窗口来源
上下文窗口为模型特定。Moltbot 使用已配置提供商目录中的模型定义确定限制。
压缩 vs 修剪
- 压缩(Compaction):摘要并在 JSONL 中持久化。
- 会话修剪(Session pruning):仅修剪旧工具结果,内存中,按请求。
修剪详情见 会话修剪。
建议
- 当会话陈旧或上下文臃肿时使用
/compact。 - 大型工具输出已被截断;修剪可进一步减少工具结果堆积。
- 需要全新开始时,
/new或/reset启动新会话 id。
最后更新于: