标签: 部署 - 学习笔记

2026-06-03发表2026-06-03更新技术笔记14 分钟读完 (大约2045个字)

最近看到一个叫 Headroom 的项目，它的定位很直接：在内容进入大模型之前，先把 AI Agent 读取到的工具输出、日志、文件、RAG 片段和对话历史压缩掉。项目 README 里给出的说法是，它可以减少 60% 到 95% 的 token，同时尽量保持回答质量。

这篇文章先做一个快速整理：Headroom 能做什么、适合什么场景，以及如果要部署到自己的工作流里，大致应该怎么做。