OpenClaw：从对话到执行的 AI 革命

2026 年初，一个名为 OpenClaw 的开源项目在 GitHub 上创造了历史：两个月内获得超过 247,000 星标，超越 Linux 成为增长最快的开源项目。根据 Wikipedia 的记录，这不仅是一个技术现象，更标志着 AI 从"对话时代"正式迈向"执行时代"。

OpenClaw 在中文互联网迅速走红，被视作 AI 代理从“对话时代”迈向“执行时代”的里程碑。国内头部云厂商旋即推出托管方案，把“可控的 AI 执行力”送进企业与个人的私有环境，进一步推高这股浪潮。

"百虾大战"：13 家国内大厂跟进 OpenClaw 全景图

国内大厂 OpenClaw 生态全景

公司	产品/方案
字节跳动	ArkClaw + 飞书适配 + 火山引擎云部署
腾讯	WorkBuddy + QClaw（内测）+ 企微/QQ 接入 + 腾讯云部署
京东	京东云一键部署
小米	Xiaomi miclaw 手机系统层 Agent
华为	华为云一键部署
美团	联合联想百应远程部署服务
阿里	阿里云一键部署 + AgentBay
百度	App 搜索框接入 + 千帆 Skills + 百度智能云部署
网易有道	LobsterAI 桌面 Agent（已开源）
月之暗面	Kimi Claw 托管版
MiniMax	MaxClaw 托管版 + 移动端
智谱	AutoClaw（澳龙）一键安装版
360	宣布将发布一键安装版（未落地）

1. What：OpenClaw 到底是什么？

1.1 不只是聊天机器人

如果你用过 ChatGPT，可能习惯了这样的交互：

你：帮我整理一下收件箱里的邮件
ChatGPT：我可以给你一些整理邮件的建议...

而 OpenClaw 的交互是这样的：

你：帮我整理一下收件箱里的邮件
OpenClaw：[正在连接 Gmail API...]
         [已读取 127 封未读邮件...]
         [按主题分类完成，生成摘要...]
         完成！已将邮件分为 5 类，重要邮件 3 封已标记。

核心区别：ChatGPT 是顾问，OpenClaw 是执行者。

OpenClaw（龙虾）不只是一个聊天机器人，它更像是一个 24/7 待命的数字助手。你可以让它设置提醒（"每天早上 8 点提醒我查看日程"），帮你回复消息（"帮我回复 Slack 上的技术问题"），甚至处理日常事务（"帮我预订明天下午 3 点的会议室"）。它的核心能力包括本地文件读写、浏览器自动化操作、代码生成与运行、多平台消息收发、系统监控与运维等。

根据 Wikipedia 的介绍，OpenClaw 是一个免费开源的自主人工智能代理项目，能够通过大型语言模型执行任务，并以消息平台（如 WhatsApp、Telegram、Discord、Slack 等）作为主要用户界面。它被视为一个"数字员工"，能够处理实际工作，而不仅仅是提供建议。

1.2 本质：自主式 AI Agent

OpenClaw 是一个开源的自主式 AI Agent 执行引擎，由开发者 Peter Steinberger 创建。它的核心特征包括本地运行（在你自己的设备上，数据完全由你掌控）、真正执行（不只是生成代码，而是直接运行、验证、修复）、自主决策（能够分解任务、选择工具、自我检查、迭代优化）以及多平台集成（通过 Telegram、Discord、Slack 等随时随地控制）。

这意味着 OpenClaw 不仅能理解你的需求，还能在你的电脑上真正把事情做完。它可以操作文件系统、执行命令、控制浏览器、调用 API，然后把结果交给你。这是传统对话式 AI 无法做到的。

1.3 发展历程：从 Clawdbot 到 OpenClaw

项目的发展历程也很有意思：

2025.11：以 Clawdbot 名称首次发布
短暂更名：因 Anthropic 商标问题改为 Moltbot
2026.01：正式定名 OpenClaw
2026.02：病毒式传播，成为 GitHub 历史上增长最快的项目
2026.02.14：开发者宣布加入 OpenAI，项目转移到开源基金会

这个时间线本身就说明了一个趋势：2026 年是 AI Agent 元年。

2. Why：为什么 OpenClaw 如此重要？

2.1 从"智能规划"到"本地执行"

传统 AI 助手的局限很明显。它们在信息检索和代码生成上表现优秀，但无法执行文件操作、命令执行、浏览器控制等实际任务。你可以让 ChatGPT 帮你写一个 Python 脚本来整理文件，但你还需要自己复制代码、保存文件、打开终端、运行脚本。如果出错了，你还要把错误信息复制回去，让它再给你一个修改版本。

OpenClaw 填补了"智能规划"与"实际执行"之间的鸿沟。Anthropic 的实践数据表明，普通聊天消耗 1x Token，单 Agent 约 4x，多智能体系统则达到 15x。这不仅是成本的跃升，更是能力的跃升——投入更多推理算力，换取真正能落地的执行结果。

2.2 数据主权：你的数据，你做主

与 SaaS AI 助手不同，OpenClaw 的本地化特性意味着敏感数据不离开你的设备。你可以选择使用云端 API（如 Claude、GPT）或完全本地模型（如 Ollama），所有"记忆"存储在本地 Markdown 文件中，可读、可编辑、可迁移。

这在企业场景中尤为重要。字节跳动、阿里云、腾讯云等国内云厂商迅速提供 OpenClaw 托管服务，正是看中了这种"可控的 AI 执行力"。企业可以在自己的私有云上部署 OpenClaw，确保代码、文档、客户数据等敏感信息不会泄露到外部服务。

2.3 技能生态：可扩展的能力边界

OpenClaw 拥有类似 npm 或浏览器插件的"技能（Skills）"生态系统。每个技能本质上是一组工具定义（告诉 Agent 能做什么）、配置模板（如 API 密钥）和提示词指令（如何更好地使用这些工具）。

你可以通过简单的命令安装技能：安装天气查询技能后，OpenClaw 就能回答"明天会下雨吗"；安装 Gmail 集成后，它就能帮你管理邮件；安装代码审查技能后，它就能自动检查 PR。这让 OpenClaw 的能力边界可以无限扩展，社区贡献的技能越多，它能做的事情就越多。

3. How：OpenClaw 如何工作？

3.1 核心架构

OpenClaw 的架构分为四层。最上层是消息渠道（Channels），支持 Telegram、Discord、Slack、CLI 等多种接入方式，你可以在任何地方给它发指令。第二层是智能决策核心（Brain），负责 LLM 推理、任务分解与规划、工具选择与调用。第三层是技能插件系统（Skills），提供文件操作、Shell 命令、浏览器控制、API 集成等能力。最底层是记忆与身份系统（Memory & Identity），由一组 Markdown 文件构成：IDENTITY.md（助理身份）、SOUL.md（性格与行为准则）、USER.md（你的信息）、AGENTS.md（工作流程）、TOOLS.md（环境配置）、MEMORY.md（长期记忆）、HEARTBEAT.md（定期巡检）、BOOT.md（启动任务）、BOOTSTRAP.md（首次初始化）以及对话历史（短期上下文）。

这种分层设计让 OpenClaw 既灵活又可控。你可以通过修改 SOUL.md 来定制 Agent 的性格和行为准则，通过 USER.md 和 MEMORY.md 让它认识你并记住你的偏好，通过安装不同的技能来扩展它的能力。详细介绍见第九章个人助理与内容创作。

3.2 典型执行流程

以"生成周报并发送给团队"为例，整个执行流程是这样的：

用户输入需求后，Agent 首先分解任务：读取本周 Git 提交记录、调用项目管理工具 API 获取任务完成情况、生成结构化周报、通过邮件发送。然后开始执行与验证：读取 Git log 发现 23 次提交，调用 Jira API 获取 5 个已完成任务，使用 Markdown 格式生成周报，验证收件人地址后发送邮件，最后返回发送状态。

整个过程中，Agent 会进行自我检查：周报是否包含所有关键信息？格式是否符合团队规范？邮件是否成功发送？如果某一步失败，它会自动重试或调整策略。这种自主性、工具调用能力和验证循环，是传统对话式 AI 无法实现的。

3.3 与传统 AI 的本质区别

OpenClaw 和 ChatGPT 的区别不只是"能不能执行命令"这么简单。更深层的区别在于交互模式：传统 AI 是一问一答，OpenClaw 是任务驱动。在上下文管理上，传统 AI 只有单次对话的记忆，OpenClaw 有持久化的长期记忆。在工具使用上，传统 AI 只能模拟或建议，OpenClaw 能真实调用。在错误处理上，传统 AI 需要用户手动修复，OpenClaw 会自动重试和调整。

最重要的是运行方式的不同。ChatGPT 是在线服务，你的数据必须发送到 OpenAI 的服务器。OpenClaw 可以完全本地运行，或者自托管在你自己的服务器上。这意味着你可以用它处理敏感信息，而不用担心数据泄露。

4. The Tradeoff：价值与代价

4.1 多智能体的优势

OpenClaw 的多智能体架构带来了三大优势。首先是并行探索：当你需要研究竞品分析时，主 Agent 可以派出多个 Sub-agent 分别搜索技术文档、分析市场报告、爬取价格信息，最后汇总生成综合分析报告。这比单个 Agent 串行执行快得多。

其次是上下文隔离。当主对话积累太多失败尝试时，上下文会变得混乱，Agent 的决策质量会下降，甚至可能重复之前已经失败的路径。这时候 Sub-agent 可以在干净的上下文中执行子任务，避免"上下文退化"。

第三是推理算力扩展。单个 Agent 受限于上下文窗口（如 200K tokens），多 Agent 可以突破这个限制。每个 Sub-agent 都有自己的上下文空间，系统的总 Token 预算可以远超单个 Agent 的限制。

4.2 需要警惕的代价

但代价同样明显。Token 成本从 1x 跃升到 15x，这不是小数目。如果你每天大量使用 OpenClaw，API 费用可能会很高。更隐蔽的问题是信息传递损耗：每次 Agent 间传递都会丢失部分上下文细节，产生"电话游戏"效应。Orchestrator 将任务传递给 Sub-agent 时，原始意图中的微妙之处可能被简化；Sub-agent 返回结果时，探索过程中的上下文线索又被压缩掉。

还有一个容易被忽视的问题是隐式决策链断裂。每一个代码变更背后都隐含着未被显式写出的决策逻辑。当多个 Agent 并行工作时，Sub-agent A 可能选择了某种数据结构，Sub-agent B 不知情地引入了不兼容的依赖。冲突的根源不是代码错误，而是决策上下文碎片化。

Important Anthropic 的实践经验："我们看到有些团队投入数月构建复杂的多智能体架构，结果发现改进单智能体的提示词就能达到同等效果。"

4.3 何时使用多 Agent？

核心判断标准是上下文耦合度。代码库搜索、信息收集、黑盒验证等低耦合任务适合拆分，因为这些子任务之间互不依赖，各自的结果可以独立产出。核心编码、架构设计、状态共享等高耦合任务应保持单一，因为这些任务需要完整的上下文才能做出正确的决策。

简单来说：如果两个子任务需要共享大量上下文才能各自正确完成，就不要拆分。如果两个子任务可以独立完成，只需要在最后汇总结果，那就适合拆分。

5. Real World：实际应用场景

5.1 个人效率场景

早间简报系统是一个典型应用。你可以设置每天早上 7:00 自动触发，OpenClaw 会获取今日天气、读取日历事件、检查重要邮件，然后生成一份简报推送到你的 Telegram。这样你起床后第一时间就能知道今天的安排和需要注意的事项。

邮件自动分类也很实用。OpenClaw 可以定期扫描你的 Gmail 收件箱，识别邮件类型（工作、个人、营销），提取关键信息，自动标记优先级，最后生成每日摘要。这比手动整理邮件效率高得多，而且不会遗漏重要信息。

5.2 开发者工作流

代码审查助手可以在你提交 PR 后自动触发。它会读取 PR diff，检查代码规范，识别潜在 bug，生成审查意见，然后自动评论到 PR 上。这不仅节省了人工审查的时间，还能保证审查的一致性和全面性。

文档同步是另一个痛点。当你修改函数签名时，OpenClaw 可以监听代码变更，自动更新 API 文档，生成使用示例，更新 CHANGELOG，最后提交一个文档 PR。这样文档就不会和代码脱节，团队成员总能看到最新的文档。

5.3 企业级应用

客户支持自动化可以大幅降低人工成本。OpenClaw 可以接入 Slack、邮件、工单系统等多个渠道，理解客户问题，搜索知识库，生成解决方案。如果问题太复杂，它会自动升级到人工客服，并附上已经收集的信息和初步分析。

数据分析报告也可以自动化。设置每周一早上 9:00 触发，OpenClaw 会从数据库、API、日志等多个数据源提取数据，生成核心指标趋势图，进行异常检测，提出优化建议，最后自动发送给相关团队。这让数据驱动决策变得更容易。

6. Getting Started：如何开始

6.1 四种使用方式

AutoClaw 一键安装（推荐新手）：智谱推出的 AutoClaw（澳龙）是国内首个一键安装版 OpenClaw 桌面客户端。下载 → 双击 → 手机号注册 → 开始用，预装 50+ 热门技能，内置龙虾专属模型 Pony-Alpha-2 和浏览器操作能力，新用户限时赠送 2000 积分。如果你只想最快用上龙虾，这是最佳选择。 支持 macOS 和 Windows，详见第一章。

本地手动安装：适合想完全掌控配置和数据的用户，也是接入 QQ 机器人等场景的必选项。在终端执行几行命令即可完成安装，你可以自由选择模型提供商、自定义所有配置。本教程的主线以此方式展开。

云端托管：阿里云、腾讯云、火山引擎等国内云厂商提供 OpenClaw 托管服务，省去安装配置的麻烦，但灵活性较低。

Docker 部署：适合生产环境，可实现环境隔离、版本管理、自动重启。详见第七章。

不想折腾安装？试试云端托管

如果你不想自己安装和配置：

飞书妙搭：一键创建，云端部署 + 自动接入飞书机器人，内置飞书官方插件，限时每日赠送百万级 Tokens
ArkClaw：火山引擎 ArkClaw，需订阅 Coding Plan（Lite ¥9.90/月起，新用户 7 天免费试用）

本教程以本地安装为主线，因为这能让你完全掌控 OpenClaw 的配置和数据。云端托管的操作方式类似，学会后可以无缝迁移。

6.2 学习路径

学习 OpenClaw 分为三个阶段。第一阶段"领养 Claw"（1-2 周）主要是快速上手，学会安装、配置、基础命令，接入 Telegram 或飞书等移动端，安装和使用市场技能，创建定时任务和工作流。

第二阶段"深度使用"（2-4 周）会涉及更高级的功能，包括集成 Gmail、Calendar、Notion 等外部服务，配置多个模型（Claude、GPT、本地 Ollama），在 VPS 或 Docker 上部署生产环境，以及优化 API 费用。

第三阶段"构建 Claw"（4-8 周）是深入理解原理，从零实现一个简化版的 AI Agent。你会学习 Agent Loop 和工具调用的核心机制，技能系统的解析和加载，多渠道消息适配器的设计，以及工作区 Markdown 文件（IDENTITY.md、SOUL.md、USER.md、AGENTS.md、TOOLS.md、MEMORY.md、HEARTBEAT.md、BOOT.md、BOOTSTRAP.md）构成的记忆与身份系统。

6.3 注意事项

安全是第一位的。首次使用建议在测试环境，不要直接在生产数据上操作。谨慎授予文件系统权限，OpenClaw 可以读写你的文件，所以要确保它不会误删重要数据。定期审查 Agent 的操作日志，了解它做了什么。对于敏感操作（如删除文件、发送邮件），最好设置人工确认。

成本控制也很重要。设置 API 调用上限，避免因为 Agent 失控导致费用暴增。优先使用缓存和本地模型，可以大幅降低成本。监控 Token 消耗情况，了解哪些任务最耗费资源，针对性优化。

学习节奏要循序渐进。从简单任务开始（如天气查询、文件整理），逐步增加复杂度（如邮件管理、代码审查）。理解原理后再自定义技能，不要一上来就想做很复杂的东西。

7. The Future：未来展望

技术演进方向很明确。随着 Claude 4.6、GPT-5 等新模型的发布，OpenClaw 的推理能力会持续提升。多模态能力（图像、视频理解）会让它能处理更多类型的任务。更长的上下文窗口（1M+ tokens）意味着它可以一次性处理更大的项目。

协作模式也在演进。未来可能会出现 Agent 团队协作的模式，多个专业化的 Agent 各司其职，通过某种协议共享知识和状态。分布式任务执行可以让 OpenClaw 调度多台机器的资源，处理更大规模的任务。

使用门槛会持续降低。图形化配置界面可以让非技术用户也能轻松使用 OpenClaw。自然语言定义技能意味着你不需要写代码就能扩展它的能力。一键部署方案会让生产环境部署变得更简单。

生态系统方面，技能市场会走向成熟，出现数千个社区贡献的技能、企业级技能认证、技能组合推荐。企业级特性会包括团队协作与权限管理、审计日志与合规性、私有化部署方案。开发者工具链会提供 Agent 调试工具、性能分析器、技能开发 SDK。

OpenClaw 的崛起标志着三个重要趋势：AI 应用范式从"辅助决策"转向"自主执行"，开源 AI 的社区驱动创新速度超越闭源产品，本地化 AI 让数据主权和隐私保护成为核心竞争力。正如 Peter Steinberger 所说："OpenClaw 不是终点，而是起点。我们正在见证 AI Agent 时代的黎明。"

8. 开始你的旅程

OpenClaw 代表了 AI 发展的一个关键转折点：从对话到执行，从建议到行动。它不是完美的，有成本、有风险、有学习曲线。但它打开了一扇门，让我们看到 AI 可以成为真正的"数字员工"，而不仅仅是聊天伙伴。

本教程分为两部分。"领养篇"帮你快速上手，把 OpenClaw 变成日常效率工具。"构建篇"带你从零实现，深入理解 Agent 的工作原理。无论你是想提升个人效率，还是想构建自己的 AI Agent 系统，这里都是一个好的起点。

让我们开始吧。🦞

下一步：第一章拥有你的第一个 QQ AI 助手

OpenClaw：从对话到执行的 AI 革命 ​

1. What：OpenClaw 到底是什么？ ​

1.1 不只是聊天机器人 ​

1.2 本质：自主式 AI Agent ​

1.3 发展历程：从 Clawdbot 到 OpenClaw ​

2. Why：为什么 OpenClaw 如此重要？ ​

2.1 从"智能规划"到"本地执行" ​

2.2 数据主权：你的数据，你做主 ​

2.3 技能生态：可扩展的能力边界 ​

3. How：OpenClaw 如何工作？ ​

3.1 核心架构 ​

3.2 典型执行流程 ​

3.3 与传统 AI 的本质区别 ​

4. The Tradeoff：价值与代价 ​

4.1 多智能体的优势 ​

4.2 需要警惕的代价 ​

4.3 何时使用多 Agent？ ​

5. Real World：实际应用场景 ​

5.1 个人效率场景 ​

5.2 开发者工作流 ​

5.3 企业级应用 ​

6. Getting Started：如何开始 ​

6.1 四种使用方式 ​

6.2 学习路径 ​

6.3 注意事项 ​

7. The Future：未来展望 ​

8. 开始你的旅程 ​