5张图看懂OpenClaw的Harness设计：深度解析Gateway-First架构与Agent运行框架

摘要

本文深入解析OpenClaw的Harness设计，通过5张架构图详解其Gateway-First架构、核心组件、运行链路、记忆系统和插件系统，帮助开发者理解Agent运行框架的设计思路。

诗与远方

知行合一

近来Harness这个词非常火，而且Claude Code最近也在龙虾化，我就想深扒下OpenClaw的Harness是如何设计的呢？

于是，从OpenClaw的源码入手，深度拆解了其架构设计、运行链路、记忆系统，以及内外部Tools/Skills调用逻辑…

在做OpenClaw类项目的小伙伴，千万不要错过如下5张图：

1. 整体架构图

OpenClaw整体分层架构：从用户交互层、网关控制层、能力层与扩展层，以及底层状态存储。

由图可见，OpenClaw是个Gateway-First的项目。

它上接多渠道入口，下连会话路由、插件扩展、记忆系统和运行时，中间是一条统一的执行主链路。

那么OpenClaw是如何与LLM协作的呢？也就是它的Harness层。

可以把Harness理解成OpenClaw面向LLM的结构化运行壳：

它负责组装prompt、挂载tools、接入skills和memory、处理策略与安全限制，再通过Provider Adapter与不同厂商的LLM API交互。

因为有Harness，OpenClaw才不是”直接把文本丢给模型”，而是真正具备了可扩展、可控制、可落地的Agent运行能力。

2. Harness的核心组件

输入与上下文

Harness的原料层，包括：

用户消息/命令
会话历史
工作区文件
bootstrap上下文
以及插件提供的tools/skills等能力

Prompt装配器

将：

system prompt
skills prompt
docs
bootstrap文件
运行时信息

等拼成最终给模型的提示词。

模型解析与策略

这一层决定：

到底用哪个模型
什么thinking档位
哪个认证身份

同时也处理：

模型fallback
部分hooks对模型选择和prompt的干预等

工具与安全壳

限制模型可调用能力边界，避免直接乱碰系统，增强安全性。

Agent会话与执行循环

这是Agent Loop的执行层，负责：

创建Agent Session
接收流式输出
处理Tool Call
再把工具结果回灌给模型

厂商适配器

将不同模型厂商的API调用统一封装，免除上层为每家模型重写一套运行逻辑。

传输与认证

负责连上模型服务，包括：

HTTP
SSE
WebSocket

等传输方式与认证机制。

LLM API

OpenClaw的Prompt、Tools、参数都会在这里给大模型，模型返回的内容也从这里返回。

会话持久化与回传

结果落地层，把：

transcript
stream delta
最终回复

写回会话，并将结果继续投递到飞书、WebChat、CLI等上层入口。

3. 核心运行链路

消息为什么能跨渠道共享上下文？

无论消息来自CLI、WebChat还是外部渠道，最终都会落到同一条执行主线：先找Session，再跑Agent，再决定如何回传。

各模块的配合如下：

Telegram/Slack/飞书等渠道负责接消息
Routing负责找到正确的Agent和Session
编排层负责将消息组织成一次可执行任务（包括上下文整理、状态反馈等）
Agent负责生成内容，结合prompt/memory/skills等完成推理
outbound/channel plugin负责将结果按对应渠道返回

4. 消息传递时序图

展示当一条消息从”收进来”到”发回去”的全过程，各个核心组件之间的交互顺序。

OpenClaw收到消息后，会先完成：

去重
顺序控制
基础校验

再结合账号、会话和话题线程，定位到正确的Agent和Session。

接下来，系统会把正文、媒体、回复引用这些信息统一整理成上下文，再交给Agent Runtime执行。这个过程中，策略判断、hooks、typing状态、skills、工具调用和记忆检索都会参与进来。

等Agent产出结果后，系统再根据replyTo和线程关系，选择正确的投递目标，把回复发回Telegram等渠道。

5. 记忆系统

OpenClaw的记忆不是单一模块，而是由三部分共同组成：

工作区里的记忆文件（MEMORY.md 和 memory/*.md）
Agent运行时里的记忆工具
后台索引与检索层

如图所示：

在工作区，MEMORY.md 和 memory/*.md 是记忆本体，属于长期记忆。
在Agent Runtime中，MEMORY.md 直接注入上下文，只覆盖会话启动时的上下文，而 memory/*.md 是通过 memory_search / memory_get 按需读取。
后台还有个Memory索引与检索层，会把 MEMORY.md 和 memory/*.md 建成每个agent一份的SQLite索引，索引层负责chunk/embedding/检索，不是记忆内容本身。

另外，关于小龙虾的人设文件（SOUL.md / ENTITY.md / USER.md 等），虽然也是bootstrap persona上下文，但不在 memory_search 索引体系，不属于严格意义上的记忆，属于persona/identity注入。

6. 插件系统设计

Gateway为中枢，插件系统是小龙虾的无限能力扩展。

下图展示了插件从”发现、加载、注册到运行时激活”的生命周期，以及Plugin SDK如何支持不同类型的插件。

OpenClaw的插件不是把能力写死在主流程里。

系统会先：

发现插件
校验声明文件
再按配置决定哪些插件真正进入运行时

进入运行时后，插件能力不会直接散落在系统各处，而是先汇总到”运行时激活注册表”：

渠道插件：负责接消息入口
平台插件：负责扩展tools、hooks、providers和skills
Gateway注入点：负责将这些能力接到methods、routes、services上

总结

OpenClaw的Harness设计非常精妙，它通过分层架构、统一的执行链路、灵活的记忆系统和插件系统，构建了一个强大且可扩展的Agent运行框架。

这套设计让OpenClaw既能支持多渠道接入，又能灵活扩展能力，同时保证了系统的安全性和可维护性。

对于想做Agent类项目的开发者来说，OpenClaw的Harness设计是一个很好的学习案例。

5张图看懂OpenClaw的Harness设计：深度解析Gateway-First架构与Agent运行框架

摘要

诗与远方

知行合一

1. 整体架构图

2. Harness的核心组件

输入与上下文

Prompt装配器

模型解析与策略

工具与安全壳

Agent会话与执行循环

厂商适配器

传输与认证

LLM API

会话持久化与回传

3. 核心运行链路

消息为什么能跨渠道共享上下文？

4. 消息传递时序图

5. 记忆系统

6. 插件系统设计

总结

相关阅读

评论(0)

提示：请文明发言取消回复

文章展示

Java AI 智能体开发框架全面对比：Spring AI、LangChain4j、AgentScope-Java、Spring AI Alibaba、Semantic Kernel

Karpathy 编程指南：避免 LLM 编码常见错误的四大原则

AI 编程时代，程序员的核心竞争力到底是什么？从 Vibe Coding 到价值重塑

ChipLingo：面向EDA的大语言模型系统化训练框架 – 芯片设计AI突破

装上drawio skill，让AI帮你画各种图（流程图、架构图等），AI画完你还能接着改

2026北京亦庄人形机器人半程马拉松落幕：”闪电”机器人夺冠，技术水平显著提升

排行榜展示

大数据GDE中台架构分享

一花(ccproxy)卡密管理系统免费下载

架构师能力图谱

GDSII & OASIS File 区别

standard cell (标准单元) 入门. 如何写一个 standard cell generate?

JAVA 锁的四种状态与锁升级过程图文详解

5张图看懂OpenClaw的Harness设计：深度解析Gateway-First架构与Agent运行框架

摘要

诗与远方

知行合一

1. 整体架构图

2. Harness的核心组件

输入与上下文

Prompt装配器

模型解析与策略

工具与安全壳

Agent会话与执行循环

厂商适配器

传输与认证

LLM API

会话持久化与回传

3. 核心运行链路

消息为什么能跨渠道共享上下文？

4. 消息传递时序图

5. 记忆系统

6. 插件系统设计

总结

相关阅读

评论(0)

提示：请文明发言 取消回复

相关文章

文章展示

排行榜展示

标签

提示：请文明发言取消回复