構建篇：打開引擎蓋

本篇目標： 從“駕駛員”進階爲“工程師”，理解 OpenClaw 的內部機制，掌握自定義 Skills、接入新渠道和架構優化的能力。

2026年初，當OpenClaw迅速攀升GitHub趨勢榜時，大多數人看到的是一個好用的工具。但在這背後，有一個更值得注意的趨勢：AI Agent正在從"黑盒產品"變成"可理解、可修改、可重建的基礎設施"。

在第一部分，你學會了"駕駛"——安裝、配置、使用Skills、接入移動端。這項實用技能足以讓你的日常效率提升一個量級。

但想象一下這個場景：

text

你：幫我把過去一週的重要郵件整理成周報
OpenClaw：好的，正在讀取郵件... 奇怪，有些郵件沒有顯示在結果裏
你：（困惑）爲什麼？是我的搜索詞不對，還是它漏掉了？

作爲駕駛員，你只能再試一次或換個說法。但如果你理解引擎是如何運轉的，你就能定位問題：

是exec命令的文件匹配參數不正確？
還是read工具讀取的文件範圍不夠完整？
或者是LLM在總結時壓縮掉了重要內容？

這就是第二部分的起點：從"再試一次"到"我知道爲什麼"。

1. Why：爲什麼要理解底層

1.1 解決那些"說不清的問題"

使用AI工具時，最讓人沮喪的不是"它做錯了"，而是"我不知道它爲什麼錯"。

讓我們看幾個真實的場景：

場景一：記憶丟失

你一週前告訴OpenClaw："我習慣用Tab而不是空格縮進。"今天它生成代碼時，又用了4個空格。

作爲用戶，你只能再次糾正。但如果你理解它的記憶系統，你會知道：

用戶偏好存儲在MEMORY.md中
該文件有大小限制，舊內容會被壓縮
更可能的是，你的偏好只是被當作了"對話歷史"
解決方案是在AGENTS.md中明確寫入編碼規範

場景二：工具選擇錯誤

你讓OpenClaw分析項目代碼結構，它用exec工具調用find命令時參數設置不合理，導致找不到關鍵文件。

理解工具系統後你會發現：

工具描述（description）的質量直接影響LLM的選擇
OpenClaw的提示詞中可能缺乏對文件搜索最佳實踐的具體說明
你可以通過修改TOOLS.md來優化工具描述，讓LLM做出更好的選擇

場景三：響應太慢

一次簡單的文件查詢要等十幾秒。

理解架構後，你能定位到：

是Gateway到模型服務的網絡延遲？
還是LLM的推理時間過長？
或者是消息在隊列中的排隊等待？
你可以通過openclaw logs查看具體哪個環節在耗時

這些問題的共同點是：表面上是"AI不聽話"，實際上是"某個環節的配置或設計不符合預期"。當你理解底層機制，診斷時間能從幾小時縮短到幾分鐘。

1.2 掌握AI時代的"元能力"

讓我們坦誠地說：OpenClaw不會永遠是最好的AI Agent工具。

回顧AI發展歷程：2023年是AutoGPT的爆發期，2024-2025年各類Agent框架層出不窮。技術迭代的速度遠超任何人的學習速度。

但有一些概念是跨框架、跨時代的：

概念	在OpenClaw中	在其他框架中
Agent Runtime	Gateway→Agent Runtime→Clients/Nodes架構	LangChain的Chains、AutoGPT的Executor
Agent Loop	接收→上下文組裝→模型推理→工具執行→回覆	幾乎所有Agent的核心範式
記憶分層	SOUL.md(身份)+MEMORY.md(事實)+對話歷史	向量數據庫+緩存+上下文窗口管理
工具抽象	read/exec/edit/write核心工具	Function Calling、Tool Use、Plugin系統
多渠道接入	Telegram/Discord/Slack適配器	統一的Channel Interface

第二部分要給你的，就是這些底層概念的具體實現案例。

當你理解了OpenClaw的ReAct循環實現，看到LangGraph的節點設計時就會恍然大悟："哦，這是把循環的每個階段顯式建模爲圖節點"。當你理解了OpenClaw的提示詞系統，再看任何新的Agent框架時都會本能地去尋找"它的系統提示詞在哪裏定義"。

這種能力不會過期。無論明年流行什麼框架，你都能快速上手，因爲你看穿的是本質，不是表象。

1.3 創造的可能性

這裏有一個值得關注的事實：OpenClaw的官方Skills數量有限，但社區已經湧現出大量第三方Skills。

這些Skills是誰寫的？是像你一樣理解了底層機制的開發者。

編程助手Skill：讓OpenClaw理解團隊代碼規範，自動生成符合規範的代碼
股票分析Skill：連接交易API，每天早上推送定製化的市場分析報告
智能客服Skill：接入公司知識庫，自動回答常見客戶問題
個人知識管理Skill：自動整理筆記、提取待辦事項、建立知識關聯

這些不是OpenClaw官方提供的功能，而是社區開發者基於OpenClaw架構創造的。

當你理解了如何構建Skills、如何修改提示詞、如何接入新的渠道，你就從"消費者"變成了"創造者"。

更進一步，如果你對某個特定場景有獨特需求，現有的OpenClaw可能無法完美滿足。這時候你可以選擇：

NanoClaw路線：用極小的代碼量實現一個極簡但專屬於你的Agent
Fork路線：基於OpenClaw源碼修改，適配你的工作環境
IronClaw路線：添加安全加固、審計日誌、權限控制，滿足合規要求

第二部分會展示這些路線的真實案例，讓你看到從理解到創造的具體路徑。

1.4 職業價值的延伸

讓我們現實一點：學習這些能給你帶來什麼實際的好處？

根據AI開發市場的趨勢觀察：

能夠熟練使用AI Agent工具的開發者，在就業市場上更具競爭力
能夠開發定製Skills、接入企業系統的開發者，在自由市場上有較高的需求
能夠基於Agent架構進行深度定製的技術顧問，項目價值通常在較高區間

這個市場的需求是真實的，且目前的供給相對不足。

更重要的是，這種技能具有累積效應。你今天理解的ReAct循環、明天掌握的Skill開發、後天學會的多渠道接入，這些能力會疊加在一起，讓你在AI應用開發領域的競爭力指數級增長。

2. What：你會看到什麼

第二部分不是源碼閱讀指南，而是一次架構探險。我們會從不同角度、不同深度來觀察OpenClaw這個系統。

2.1 第一板塊：解剖OpenClaw（第1-6章）

這一板塊會像解剖精密儀器一樣，逐層深入OpenClaw的核心機制。

第1章：核心定位與設計理念

探討一個根本問題：Agent Runtime和Chatbot的本質區別是什麼？

這不僅僅是"一個會執行一個不會"那麼簡單。你會發現：

爲什麼OpenClaw選擇自託管而非雲端託管
核心工具（read/exec/edit/write）背後的設計哲學
WebSocket Gateway架構如何讓系統保持松耦合
這些設計選擇帶來的優勢與代價

第2章：整體架構解析

你會看到一張完整的架構圖：

text

用戶消息 → Gateway（WebSocket網關）→ Agent Runtime（決策核心）
                                              ↓
結果返回 ← Gateway ← 工具執行 ← LLM推理

我們會詳細解釋：

Gateway如何處理來自不同渠道（Telegram/Discord/Web）的消息
Command Queue如何管理命令隊列、保證順序、處理併發
Agent Runtime如何分解任務、選擇工具、管理狀態
Agent如何調用LLM、解析響應、處理錯誤

第3章：提示詞系統

這是OpenClaw最獨特的設計之一：用多個Markdown文件來定義Agent的"人格"和"知識"。

SOUL.md：Agent的身份、性格、行爲準則
USER.md：用戶畫像、偏好、交互習慣
AGENTS.md：多Agent協作時的角色分工
TOOLS.md：工具的詳細說明和使用指南
MEMORY.md：長期記憶的存儲格式
HEARTBEAT.md：定時任務的觸發條件
skills/*.md：各個技能的特定指令

你會理解：

這些文件如何被組合成最終的系統提示詞
熱更新機制如何讓修改立即生效
如何通過調整提示詞來精細控制Agent行爲
Token限制的分配策略（多少給系統提示詞，多少給對話歷史）

第4章：工具系統

OpenClaw的核心能力來自於它的工具。我們會深入：

核心工具（read/exec/edit/write/memory_search/memory_get/subagent等）的實現原理
工具描述的撰寫藝術（如何讓LLM準確理解工具的用途）
Skill的層次結構：從簡單的描述到複雜的TypeScript實現
工具註冊機制：動態加載、版本管理、衝突解決

第5章：消息循環與事件驅動

這是Agent的"心跳"。你會看到：

Agent Loop的完整執行流程
LLM如何根據當前狀態選擇下一個工具
心跳機制（Heartbeat）如何實現定時任務
錯誤處理與重試策略
超時控制與優雅降級

第6章：多渠道接入

OpenClaw可以同時運行在多個平臺上。我們會探討：

Gateway如何集成不同平臺的SDK（grammY、discord.js等）
消息格式的轉換與標準化
跨渠道的狀態同步
平臺特定功能（如Telegram的按鈕、飛書的卡片消息）的適配

2.2 第二板塊：探索替代方案（第7-10章）

理解一個系統的最好方式，是看看其他人是如何解決同樣問題的。

第7章：輕量化方案

NanoClaw：極簡TypeScript代碼實現最核心的Agent Loop（第三方開源項目）
Nanobot：精簡版，接近生產可用（第三方開源項目）
ZeroClaw：去除廠商依賴、完全本地運行的版本（第三方開源項目）

你會看到：複雜的功能可以被簡化到什麼程度？哪些功能是不可或缺的，哪些是可以犧牲的？

第8章：安全加固方案

IronClaw：企業級安全架構（第三方開源項目）
- 權限控制：哪些工具可以被調用、哪些文件可以被訪問
- 沙箱隔離：防止Agent執行危險操作
- 審計日誌：記錄每一次工具調用和LLM交互
- 敏感數據保護：API密鑰、個人信息的加密存儲

第9章：硬件方案

PicoClaw：運行在樹莓派上的低功耗版本（第三方開源項目）
- 硬件選型：爲什麼選擇ARM架構？
- 功耗優化：如何讓Agent在電池供電下運行數天
- 離線能力：完全無網絡環境下的本地推理

第10章：案例對比總結

我們會建立一個多維度的對比矩陣：

維度	OpenClaw	NanoClaw	IronClaw	PicoClaw
代碼量	數萬行	數百行	數萬行	數千行
功能豐富度	極高	核心功能	高+安全	中
部署難度	中	極低	高	中
適用場景	通用	學習/原型	企業	邊緣計算

以及一個決策樹：根據你的需求（功能、安全、成本、硬件限制），應該選擇哪個方案作爲起點。

2.3 第三板塊：創造你自己的（第11-15章）

這一板塊是關於"動手"的，但不是枯燥的編碼教程，而是基於真實場景的創造指南。

第11章：定製路徑概覽

不是四級難度的硬性分層，而是四種不同的"玩法"：

配置玩家：通過修改JSON和Markdown文件，零代碼實現個性化
Skill開發者：爲社區貢獻新的工具集成
架構調整者：修改核心模塊，適配特殊需求
造輪子愛好者：從零開始，理解每一個細節

每種玩法都有它的樂趣和價值，你可以根據自己的目標選擇，也可以在不同玩法之間切換。

第12章：配置文件級定製

~/.openclaw/openclaw.json的完整結構解析
Providers配置：如何接入不同的LLM（Claude、GPT、本地模型）

工具白名單：限制Agent的能力範圍
安全策略：文件訪問控制、網絡請求限制

第13章：Skill開發實戰

從最簡單的描述型Skill到複雜的TypeScript實現：

SKILL.md的Frontmatter格式
impl/目錄中的實現代碼
異步處理與錯誤邊界
調試與測試技巧
發佈到社區倉庫的流程

第14章：渠道接入實戰

飛書接入：Webhook、機器人、審批流程
飛書接入：事件訂閱、消息格式、卡片模板
編寫自定義渠道適配器
多渠道配置的協同與衝突處理

第15章：完整定製案例

三個從真實需求出發的完整案例：

編程助手型：深度集成VSCode，理解項目結構，生成符合團隊規範的代碼
個人效率助手型：整合郵件、日曆、筆記、待辦事項的智能助理
智能客服機器人型：基於知識庫的多輪對話系統，支持人工接管

每個案例都會展示：需求分析→架構選型→開發過程→部署維護的完整週期。

3. How：如何探索這一部分

3.1 三條入口路徑

我們設計了三個不同的入口，你可以根據自己的狀態選擇：

路徑A：原理派

如果你好奇"它是怎麼工作的"，從第1章開始，按順序讀到第6章。這是理解最系統的路徑。

路徑B：對比派

如果你已經有一些使用經驗，想知道"還有什麼其他可能"，跳到第7章看案例分析。看到NanoClaw的極簡實現，你會對"什麼是最小必要功能"有全新的認識。

路徑C：需求派

如果你已經有一個具體的定製目標（"我想讓它接入公司的XX系統"），直接跳到第11-15章。邊讀邊做，在實踐中有針對性地回頭查原理。

3.2 理解的層次

對於每一個概念，你不需要"全都要"。根據你的目標，選擇理解的深度：

深度	適合人羣	學習方式
概念級	大多數讀者	知道"有這個模塊"、"它負責什麼"就夠了
原理級	想深入理解的讀者	理解它是如何工作的、爲什麼這麼設計
代碼級	想定製開發的讀者	閱讀源碼、理解實現細節、能修改

例如，對於命令隊列（Command Queue）：

概念級：知道"Command Queue負責序列化命令執行"，瞭解它在架構圖中的位置
原理級：理解隊列調度、併發控制、泳道模型（隊列模式按渠道配置：steer/followup/collect/steer-backlog/steer+backlog/queue/interrupt）
代碼級：能閱讀並修改Command Queue的實現，添加新的隊列模式或處理器

你可以在不同概念上選擇不同的深度。比如在提示詞系統上深入（因爲你想定製Agent性格），但在渠道接入上保持概念級（因爲你只用Telegram）。

3.3 實踐的建議

雖然我們沒有強制的"課後作業"，但我們建議你：

讀一章，改一點

讀完提示詞系統的章節，試着修改你的SOUL.md，看看Agent的回應風格如何變化
讀完工具系統的章節，試着寫一個最簡單的Skill（比如一個返回當前時間的工具）
讀完架構解析的章節，試着用openclaw logs觀察一次完整的消息流轉

帶着問題讀

如果你在使用OpenClaw時遇到了奇怪的行爲，把它當作一個探索的契機：

"爲什麼它這次沒有調用我預期的工具？" → 去第4章看工具選擇的機制
"爲什麼它忘了我們之前的約定？" → 去第3章看記憶系統的設計
"爲什麼響應這麼慢？" → 去第5章看消息循環的執行流程

做筆記，畫圖表

學習複雜系統的最好方式，是用你自己的方式重新組織它：

畫一張你自己的架構圖（即使不準確，也是你理解的外化）
列出你關心的概念和它們的關聯
記錄你遇到的問題和找到的解決方案

4. The Tradeoff：代價與收益

在進入之前，我們需要誠實地談談代價。

4.1 你需要投入的

注意： 學習這部分內容需要投入更多精力，但回報是長期的。

點擊展開：學習代價詳情

時間

第二部分的內容量比第一部分多。完整閱讀所有章節需要一定的投入時間。如果要動手實踐，時間會更長。

但記住，這不是考試，沒有截止日期。你可以用一個月，也可以用半年。

認知負荷

這部分內容涉及：

TypeScript/JavaScript代碼（OpenClaw使用Node.js開發）
系統設計概念（事件驅動、消息隊列、狀態管理）
AI原理（LLM的行爲特性、提示詞工程、ReAct範式）

如果你在某些領域不熟悉，可能需要額外查資料。這很正常。

挫敗感

理解複雜系統不是線性的。你可能花了一小時讀某章，卻感覺什麼都沒懂。或者你覺得自己懂了，動手時卻發現完全不是那麼回事。

這種挫敗感是學習曲線的正常部分。每一個真正理解OpenClaw的人都經歷過。

4.2 你會得到的

解決複雜問題的能力

當你遇到OpenClaw的奇怪行爲時，診斷時間從幾小時變成幾分鐘。當你需要定製功能時，你知道從哪裏下手。

跨框架的遷移能力

明年出現新的Agent框架時，你能在幾天內上手，因爲你看穿的是本質。

創造的可能性

從修改配置到開發Skills，從Fork修改到從零構建，你有一整套工具來表達你的想法。

潛在的經濟回報

無論是求職時的競爭力提升，還是作爲自由職業者的技能儲備，這都是一個有市場需求的能力。

4.3 一個誠實的建議

不是每個人都需要深入這一部分。

如果你使用OpenClaw的過程中：

現有Skills已經滿足了你的大部分需求
你沒有遇到"無法理解"的奇怪行爲
你對"底層原理"沒有強烈的好奇心
你的時間和精力有限

那麼，停留在第一部分是完全合理的選擇。你可以隨時回來，當某個具體的問題驅動你深入時。

最好的學習動機是"我需要解決這個問題"，而不是"我應該學完這個教程"。

5. 從駕駛員到工程師

讓我們回到那個汽車的比喻。

第一部分教你駕駛——踩油門、打方向、看儀表盤。這讓你能快速到達很多地方。

第二部分帶你打開引擎蓋——看引擎如何燃燒、變速箱如何換擋、電路如何控制。這不會讓你開得更快，但當你聽到異響時，你知道問題在哪裏。當你想要改裝時，你知道從哪裏下手。當你面對一輛陌生的車時，你能更快地理解它。

更重要的是，你開始具備設計和製造的能力。

也許你不會真的去造一輛車。但當你理解了引擎的原理，你對"移動"的理解就永遠改變了。你不再是交通工具的被動消費者，而是有能力參與創造的人。

AI Agent正在成爲一種基礎設施工具，就像數據庫、Web服務器、操作系統一樣。今天理解它的底層機制，就像1995年理解HTTP協議、2005年理解Linux內核、2015年理解Docker容器。

這種理解不會立刻變現，但它是長期投資。它會在未來的某個時刻，讓你看到一個別人看不到的機會，或者解決一個別人無法解決的問題。

現在，選擇你想開始的地方：

第一章：核心定位與設計理念 —— 理解Agent Runtime的本質，看看OpenClaw爲什麼被設計成現在這樣
第七章：輕量化方案 —— 看看NanoClaw如何用極簡代碼實現核心功能
第十一章：定製路徑概覽 —— 如果你已經有了具體的定製目標

或者，如果你還不確定，可以先翻翻目錄，看看哪個章節標題引起了你的好奇心。

學習沒有標準路徑。你的問題、你的好奇心、你的需求，就是最好的導航。

讓我們開始吧。

構建篇：打開引擎蓋 ​

1. Why：爲什麼要理解底層 ​

1.1 解決那些"說不清的問題" ​

1.2 掌握AI時代的"元能力" ​

1.3 創造的可能性 ​

1.4 職業價值的延伸 ​

2. What：你會看到什麼 ​

2.1 第一板塊：解剖OpenClaw（第1-6章） ​

第1章：核心定位與設計理念 ​

第2章：整體架構解析 ​

第3章：提示詞系統 ​

第4章：工具系統 ​

第5章：消息循環與事件驅動 ​

第6章：多渠道接入 ​

2.2 第二板塊：探索替代方案（第7-10章） ​

第7章：輕量化方案 ​

第8章：安全加固方案 ​

第9章：硬件方案 ​

第10章：案例對比總結 ​

2.3 第三板塊：創造你自己的（第11-15章） ​

第11章：定製路徑概覽 ​

第12章：配置文件級定製 ​

第13章：Skill開發實戰 ​

第14章：渠道接入實戰 ​

第15章：完整定製案例 ​

3. How：如何探索這一部分 ​

3.1 三條入口路徑 ​

3.2 理解的層次 ​

3.3 實踐的建議 ​

讀一章，改一點 ​

帶着問題讀 ​

做筆記，畫圖表 ​

4. The Tradeoff：代價與收益 ​

4.1 你需要投入的 ​

時間 ​

認知負荷 ​

挫敗感 ​

4.2 你會得到的 ​

解決複雜問題的能力 ​

跨框架的遷移能力 ​

創造的可能性 ​

潛在的經濟回報 ​

4.3 一個誠實的建議 ​

5. 從駕駛員到工程師 ​