📋
Abstract — 核心判断

AI Agent 时代,Harness(编排/脚手架层)与 Memory(记忆层)不可分割——选择闭源 Harness 即意味着放弃对 Memory 的控制权。这是模型厂商锁定用户的核心手段,是一个正在发生且不可逆的结构性趋势。LangChain 创始人 Harrison Chase 在 2026 年 4 月发布的博文《Your Harness, Your Memory》系统阐述了这一判断。

01 · 框架演进

Harness 的三次演变

理解 Memory 与 Harness 的锁定逻辑,需要先理解 Harness 在 AI Agent 构建中的角色演变。

2023 年 — RAG 时代。 ChatGPT 刚出来时,Harness 的形态是最原始的——基本等于把用户问题和一个文档拼在一起交给模型。没有编排,没有状态管理,没有工具调用流水线。

2024 年 — Long Graph 时代。 模型变强了,能处理更复杂的流程和任务,出现了 Long Graph 时代的工具编排,LangGraph 是代表产品。工作流的链路和复杂度开始被结构化管理,但 Harness 仍然被认为是一个"过度阶段"的工具。

2025 年至今 — Agent Harness 时代。 模型再次跃升,催生出一大批 Agent Harness 产品和框架——包括 Cursor Agent、Cline、Claude Code,以及 MCP(Model Context Protocol)生态。Harness 不再只是编排工具,而是 Agent 工作流的事实操作系统。

📝
Note — 关键洞察

"模型变强了,不代表不需要脚手架了;旧的脚手架被淘汰了,但它被新的脚手架替代了。"——Harness 不是过渡产物,而是永久需求。

02 · 不是过渡产物

Harness 是永久需求

一个常见的误判是:随着模型能力越来越强,Scaffolding/Harness 最终会被模型吸收消失。Harrison Chase 在博文中举出了一个极具说服力的反证——

Quote — Claude Code 源码事实

Claude Code 源码泄露时被发现有 512k 行代码。这 50 多万行代码不是模型本身,而是 Harness,是围绕模型的编排系统。

连 Anthropic——全世界最强模型的创造者——都需要花这么大的力气去写 Harness。这说明 Harness 不是模型能力不足时的临时补丁,而是构建可靠 Agent 的永久性工程需求。

支撑这个判断的还有广泛流传的对照实验:同一模型、同一数据、同一 Prompt,只换外面的 Harness 层,编程基准测试成功率从 42% 跳到 78%(Nate B Jones 实验)。LangChain 自己的测试显示:同一模型只换 Harness,TerminalBench 2.0 得分从 52.8% 升至 66.5%,排名从 30 名开外冲进前 5。

📝
Note — 量化证据

这些数字比任何论断都更有说服力:模型本身的潜力,远没有被充分发挥;挡住它的,是外面那套 Harness。模型 + Prompt 只是起点,真正的工程差距在 Harness 层。

03 · 架构事实

Memory 不是插件,它就是 Harness

这是整篇分析中最核心的论断。Harrison 引用 Letta CTO Sarah Wooders 一篇文章的标题作为论证起点——《Memory isn't a plugin (it's the harness)》。

Quote — Sarah Wooders, Letta Blog

问如何把 Memory 插件挂到 Agent Harness 上,就像问如何把驾驶功能挂到汽车上。驾驶不是汽车的插件——它是汽车的基本工作方式。

要理解这个判断,需要区分两种 Memory 的归属:

短期记忆: 对话消息历史、工具调用输出、上下文压缩结果、文件系统状态——这些全都在 Harness 的管控之下。Harness 决定向 LLM 提交多少历史上下文、以什么格式组织、什么时候截断和摘要。

长期记忆: 跨会话的用户偏好、Skill 元数据、Cloud MD 加载方式——这些同样由 Harness 决定如何读取、写入和更新。

因此,Memory 分成了两层(短期/长期),但两层都是由 Harness 统一管控的。Harrison 的判断是:Memory 目前还在婴儿期,整个行业仍在摸索什么是好的 Memory;未来可能会有独立的 Memory 服务,但至少在当前,Memory 和 Harness 是绑死在一起的。

04 · 三级锁定风险

没有 Harness,就没有 Memory

文章最犀利的论断是这句话——

⚠️
Warning — 核心警告

你没有拥有 Harness,你就没有拥有 Memory。

Harrison 将风险分成三个递增的等级:

第一级 — 轻度锁定。 使用 OpenAI Responses API 或 Anthropic 服务端 Compaction,状态存储在厂商服务器上。一旦换模型,之前的对话线程无法恢复。

第二级 — 中度锁定。 使用闭源 Harness(如 Cursor Agent、Cline),底层虽然跑的是 Cloud Code,但 Cloud Code 不开源,Memory 格式未知,不可迁移。

第三级 — 致命锁定。 整个 Harness 加所有 Memory 全在 API 后面,用户完全看不见,属于零所有权。Harrison 直接点名批评的产品是 Claude Managed Agents——他认为这是 "Incredibly Alarming"(令人深感警觉)的案例。

OpenAI Codex 是一个更微妙的例子:Codex 虽然开源了,但 Compression Summary 是加密的。在 OpenAI 生态内部,用户实际上无法访问自己的 Memory 和数据。

📝
Note — 三层风险速查

① 轻度:状态存厂商服务器,换模型即丢失线程
② 中度:闭源 Harness,Memory 格式不透明不可迁移
③ 致命:Harness+Memory 全在 API 后,零所有权

05 · 锁定经济学

为什么厂商都在做这件事

底层的经济学逻辑其实很清楚——

纯模型太容易被替换了。 OpenAI 的接口和 Anthropic 的接口几乎一样,改改 Prompt 就能切换。模型厂商知道这一点,所以他们需要一个不易被复制的东西来留住用户。

Memory 就是这个锚点。 一旦用户在某个平台上积累了跨会话的用户偏好、工作流程模式、业务 context,切换平台的成本就变得极高——时间成本、精力成本,最关键的是:你会失去所有的记忆。

这就是锁定终极用户的核心机制。用户越多使用 Agent,Agent 就越了解用户;越了解用户,就越难离开。

🔥
Tip — 数据飞轮

有 Memory 的 Agent 会形成数据飞轮:用户交互产生偏好数据 → Agent 根据个性化体验变好 → 带来更多交互 → 飞轮持续转动。越用越好用,越好用越离不开。没有 Memory 的 Agent 是可替代的——任何人拿到同样的 Prompt,就能复制出一个一模一样的 Agent。

06 · 平台视角

开放 vs 封闭:谁真正拥有你的 Agent

值得注意的是,Harrison Chase 本人有推广 LangChain Deep Agents(开放 Harness 的正面实现)的动机,其核心主张——"开放 Harness 才能开放 Memory"——与 LangChain 的商业利益高度一致。但这并不意味着这个判断是错误的。

至少有两点值得注意:

这一判断还与当前 AI 开源生态的竞争趋势形成呼应:平台通过 Memory/Harness 层锁定用户,与开源生态通过开放标准争夺开发者,是一个硬币的两面。

07 · 五点核心总结

总结

  1. Agent Harness 是构建 Agents 的核心,它不会消失。 模型升级不意味着脚手架消失,只意味着脚手架升级。
  2. Memory 和 Harness 是一体的,至少当前无法分离。 所有行业重要观察者(LangChain、Letta、Anthropic)都指向同一结论。
  3. 不拥有 Harness,等于不拥有 Memory。 这个等式是理解当前平台战略的起点。
  4. 模型厂商正在用 Memory 创造锁定,而且已经发生。 Claude Managed Agents 是最新、最典型的案例。
  5. Open Harness 等于 Open Memory,等于你自己的竞争壁垒。 完全拥有 Harness 和 Memory,才能真正掌握自己的 AI 工作流,不被动迁移。
Quote — 来源文章

Harrison Chase,《Your Harness, Your Memory》, LangChain Blog, 2026-04-11
https://blog.langchain.dev/your-harness-your-memory/

Sarah Wooders,《Memory isn't a plugin (it's the harness)》, Letta Blog
https://letta.com/blog/memory-isnt-a-plugin