OpenClaw:从对话到执行的 AI 革命
2026 年初,一个名为 OpenClaw 的开源项目在 GitHub 上创造了历史:两个月内获得超过 247,000 星标,超越 Linux 成为增长最快的开源项目。根据 Wikipedia 的记录,这不仅是一个技术现象,更标志着 AI 从"对话时代"正式迈向"执行时代"。
OpenClaw 在中文互联网迅速走红,被视作 AI 代理从“对话时代”迈向“执行时代”的里程碑。国内头部云厂商旋即推出托管方案,把“可控的 AI 执行力”送进企业与个人的私有环境,进一步推高这股浪潮。
"百虾大战":13 家国内大厂跟进 OpenClaw 全景图

| 公司 | 产品/方案 |
|---|---|
| 字节跳动 | ArkClaw + 飞书适配 + 火山引擎云部署 |
| 腾讯 | WorkBuddy + QClaw(内测)+ 企微/QQ 接入 + 腾讯云部署 |
| 京东 | 京东云一键部署 |
| 小米 | Xiaomi miclaw 手机系统层 Agent |
| 华为 | 华为云一键部署 |
| 美团 | 联合联想百应远程部署服务 |
| 阿里 | 阿里云一键部署 + AgentBay |
| 百度 | App 搜索框接入 + 千帆 Skills + 百度智能云部署 |
| 网易有道 | LobsterAI 桌面 Agent(已开源) |
| 月之暗面 | Kimi Claw 托管版 |
| MiniMax | MaxClaw 托管版 + 移动端 |
| 智谱 | AutoClaw(澳龙)一键安装版 |
| 360 | 宣布将发布一键安装版(未落地) |
1. What:OpenClaw 到底是什么?
1.1 不只是聊天机器人
如果你用过 ChatGPT,可能习惯了这样的交互:
你:帮我整理一下收件箱里的邮件
ChatGPT:我可以给你一些整理邮件的建议...而 OpenClaw 的交互是这样的:
你:帮我整理一下收件箱里的邮件
OpenClaw:[正在连接 Gmail API...]
[已读取 127 封未读邮件...]
[按主题分类完成,生成摘要...]
完成!已将邮件分为 5 类,重要邮件 3 封已标记。核心区别:ChatGPT 是顾问,OpenClaw 是执行者。
OpenClaw(龙虾)不只是一个聊天机器人,它更像是一个 24/7 待命的数字助手。你可以让它设置提醒("每天早上 8 点提醒我查看日程"),帮你回复消息("帮我回复 Slack 上的技术问题"),甚至处理日常事务("帮我预订明天下午 3 点的会议室")。它的核心能力包括本地文件读写、浏览器自动化操作、代码生成与运行、多平台消息收发、系统监控与运维等。
根据 Wikipedia 的介绍,OpenClaw 是一个免费开源的自主人工智能代理项目,能够通过大型语言模型执行任务,并以消息平台(如 WhatsApp、Telegram、Discord、Slack 等)作为主要用户界面。它被视为一个"数字员工",能够处理实际工作,而不仅仅是提供建议。
1.2 本质:自主式 AI Agent
OpenClaw 是一个开源的自主式 AI Agent 执行引擎,由开发者 Peter Steinberger 创建。它的核心特征包括本地运行(在你自己的设备上,数据完全由你掌控)、真正执行(不只是生成代码,而是直接运行、验证、修复)、自主决策(能够分解任务、选择工具、自我检查、迭代优化)以及多平台集成(通过 Telegram、Discord、Slack 等随时随地控制)。
这意味着 OpenClaw 不仅能理解你的需求,还能在你的电脑上真正把事情做完。它可以操作文件系统、执行命令、控制浏览器、调用 API,然后把结果交给你。这是传统对话式 AI 无法做到的。
1.3 发展历程:从 Clawdbot 到 OpenClaw
项目的发展历程也很有意思:
- 2025.11:以 Clawdbot 名称首次发布
- 短暂更名:因 Anthropic 商标问题改为 Moltbot
- 2026.01:正式定名 OpenClaw
- 2026.02:病毒式传播,成为 GitHub 历史上增长最快的项目
- 2026.02.14:开发者宣布加入 OpenAI,项目转移到开源基金会
这个时间线本身就说明了一个趋势:2026 年是 AI Agent 元年。
2. Why:为什么 OpenClaw 如此重要?
2.1 从"智能规划"到"本地执行"
传统 AI 助手的局限很明显。它们在信息检索和代码生成上表现优秀,但无法执行文件操作、命令执行、浏览器控制等实际任务。你可以让 ChatGPT 帮你写一个 Python 脚本来整理文件,但你还需要自己复制代码、保存文件、打开终端、运行脚本。如果出错了,你还要把错误信息复制回去,让它再给你一个修改版本。
OpenClaw 填补了"智能规划"与"实际执行"之间的鸿沟。Anthropic 的实践数据表明,普通聊天消耗 1x Token,单 Agent 约 4x,多智能体系统则达到 15x。这不仅是成本的跃升,更是能力的跃升——投入更多推理算力,换取真正能落地的执行结果。
2.2 数据主权:你的数据,你做主
与 SaaS AI 助手不同,OpenClaw 的本地化特性意味着敏感数据不离开你的设备。你可以选择使用云端 API(如 Claude、GPT)或完全本地模型(如 Ollama),所有"记忆"存储在本地 Markdown 文件中,可读、可编辑、可迁移。
这在企业场景中尤为重要。字节跳动、阿里云、腾讯云等国内云厂商迅速提供 OpenClaw 托管服务,正是看中了这种"可控的 AI 执行力"。企业可以在自己的私有云上部署 OpenClaw,确保代码、文档、客户数据等敏感信息不会泄露到外部服务。
2.3 技能生态:可扩展的能力边界
OpenClaw 拥有类似 npm 或浏览器插件的"技能(Skills)"生态系统。每个技能本质上是一组工具定义(告诉 Agent 能做什么)、配置模板(如 API 密钥)和提示词指令(如何更好地使用这些工具)。
你可以通过简单的命令安装技能:安装天气查询技能后,OpenClaw 就能回答"明天会下雨吗";安装 Gmail 集成后,它就能帮你管理邮件;安装代码审查技能后,它就能自动检查 PR。这让 OpenClaw 的能力边界可以无限扩展,社区贡献的技能越多,它能做的事情就越多。
3. How:OpenClaw 如何工作?
3.1 核心架构
OpenClaw 的架构分为四层。最上层是消息渠道(Channels),支持 Telegram、Discord、Slack、CLI 等多种接入方式,你可以在任何地方给它发指令。第二层是智能决策核心(Brain),负责 LLM 推理、任务分解与规划、工具选择与调用。第三层是技能插件系统(Skills),提供文件操作、Shell 命令、浏览器控制、API 集成等能力。最底层是记忆与身份系统(Memory & Identity),由一组 Markdown 文件构成:IDENTITY.md(助理身份)、SOUL.md(性格与行为准则)、USER.md(你的信息)、AGENTS.md(工作流程)、TOOLS.md(环境配置)、MEMORY.md(长期记忆)、HEARTBEAT.md(定期巡检)、BOOT.md(启动任务)、BOOTSTRAP.md(首次初始化)以及对话历史(短期上下文)。
这种分层设计让 OpenClaw 既灵活又可控。你可以通过修改 SOUL.md 来定制 Agent 的性格和行为准则,通过 USER.md 和 MEMORY.md 让它认识你并记住你的偏好,通过安装不同的技能来扩展它的能力。详细介绍见第九章 个人助理与内容创作。
3.2 典型执行流程
以"生成周报并发送给团队"为例,整个执行流程是这样的:
用户输入需求后,Agent 首先分解任务:读取本周 Git 提交记录、调用项目管理工具 API 获取任务完成情况、生成结构化周报、通过邮件发送。然后开始执行与验证:读取 Git log 发现 23 次提交,调用 Jira API 获取 5 个已完成任务,使用 Markdown 格式生成周报,验证收件人地址后发送邮件,最后返回发送状态。
整个过程中,Agent 会进行自我检查:周报是否包含所有关键信息?格式是否符合团队规范?邮件是否成功发送?如果某一步失败,它会自动重试或调整策略。这种自主性、工具调用能力和验证循环,是传统对话式 AI 无法实现的。
3.3 与传统 AI 的本质区别
OpenClaw 和 ChatGPT 的区别不只是"能不能执行命令"这么简单。更深层的区别在于交互模式:传统 AI 是一问一答,OpenClaw 是任务驱动。在上下文管理上,传统 AI 只有单次对话的记忆,OpenClaw 有持久化的长期记忆。在工具使用上,传统 AI 只能模拟或建议,OpenClaw 能真实调用。在错误处理上,传统 AI 需要用户手动修复,OpenClaw 会自动重试和调整。
最重要的是运行方式的不同。ChatGPT 是在线服务,你的数据必须发送到 OpenAI 的服务器。OpenClaw 可以完全本地运行,或者自托管在你自己的服务器上。这意味着你可以用它处理敏感信息,而不用担心数据泄露。
4. The Tradeoff:价值与代价
4.1 多智能体的优势
OpenClaw 的多智能体架构带来了三大优势。首先是并行探索:当你需要研究竞品分析时,主 Agent 可以派出多个 Sub-agent 分别搜索技术文档、分析市场报告、爬取价格信息,最后汇总生成综合分析报告。这比单个 Agent 串行执行快得多。
其次是上下文隔离。当主对话积累太多失败尝试时,上下文会变得混乱,Agent 的决策质量会下降,甚至可能重复之前已经失败的路径。这时候 Sub-agent 可以在干净的上下文中执行子任务,避免"上下文退化"。
第三是推理算力扩展。单个 Agent 受限于上下文窗口(如 200K tokens),多 Agent 可以突破这个限制。每个 Sub-agent 都有自己的上下文空间,系统的总 Token 预算可以远超单个 Agent 的限制。
4.2 需要警惕的代价
但代价同样明显。Token 成本从 1x 跃升到 15x,这不是小数目。如果你每天大量使用 OpenClaw,API 费用可能会很高。更隐蔽的问题是信息传递损耗:每次 Agent 间传递都会丢失部分上下文细节,产生"电话游戏"效应。Orchestrator 将任务传递给 Sub-agent 时,原始意图中的微妙之处可能被简化;Sub-agent 返回结果时,探索过程中的上下文线索又被压缩掉。
还有一个容易被忽视的问题是隐式决策链断裂。每一个代码变更背后都隐含着未被显式写出的决策逻辑。当多个 Agent 并行工作时,Sub-agent A 可能选择了某种数据结构,Sub-agent B 不知情地引入了不兼容的依赖。冲突的根源不是代码错误,而是决策上下文碎片化。
Important Anthropic 的实践经验:"我们看到有些团队投入数月构建复杂的多智能体架构,结果发现改进单智能体的提示词就能达到同等效果。"
4.3 何时使用多 Agent?
核心判断标准是上下文耦合度。代码库搜索、信息收集、黑盒验证等低耦合任务适合拆分,因为这些子任务之间互不依赖,各自的结果可以独立产出。核心编码、架构设计、状态共享等高耦合任务应保持单一,因为这些任务需要完整的上下文才能做出正确的决策。
简单来说:如果两个子任务需要共享大量上下文才能各自正确完成,就不要拆分。如果两个子任务可以独立完成,只需要在最后汇总结果,那就适合拆分。
5. Real World:实际应用场景
5.1 个人效率场景
早间简报系统是一个典型应用。你可以设置每天早上 7:00 自动触发,OpenClaw 会获取今日天气、读取日历事件、检查重要邮件,然后生成一份简报推送到你的 Telegram。这样你起床后第一时间就能知道今天的安排和需要注意的事项。
邮件自动分类也很实用。OpenClaw 可以定期扫描你的 Gmail 收件箱,识别邮件类型(工作、个人、营销),提取关键信息,自动标记优先级,最后生成每日摘要。这比手动整理邮件效率高得多,而且不会遗漏重要信息。
5.2 开发者工作流
代码审查助手可以在你提交 PR 后自动触发。它会读取 PR diff,检查代码规范,识别潜在 bug,生成审查意见,然后自动评论到 PR 上。这不仅节省了人工审查的时间,还能保证审查的一致性和全面性。
文档同步是另一个痛点。当你修改函数签名时,OpenClaw 可以监听代码变更,自动更新 API 文档,生成使用示例,更新 CHANGELOG,最后提交一个文档 PR。这样文档就不会和代码脱节,团队成员总能看到最新的文档。
5.3 企业级应用
客户支持自动化可以大幅降低人工成本。OpenClaw 可以接入 Slack、邮件、工单系统等多个渠道,理解客户问题,搜索知识库,生成解决方案。如果问题太复杂,它会自动升级到人工客服,并附上已经收集的信息和初步分析。
数据分析报告也可以自动化。设置每周一早上 9:00 触发,OpenClaw 会从数据库、API、日志等多个数据源提取数据,生成核心指标趋势图,进行异常检测,提出优化建议,最后自动发送给相关团队。这让数据驱动决策变得更容易。
6. Getting Started:如何开始
6.1 四种使用方式
AutoClaw 一键安装(推荐新手):智谱推出的 AutoClaw(澳龙)是国内首个一键安装版 OpenClaw 桌面客户端。下载 → 双击 → 手机号注册 → 开始用,预装 50+ 热门技能,内置龙虾专属模型 Pony-Alpha-2 和浏览器操作能力,新用户限时赠送 2000 积分。如果你只想最快用上龙虾,这是最佳选择。 支持 macOS 和 Windows,详见第一章。
本地手动安装:适合想完全掌控配置和数据的用户,也是接入 QQ 机器人等场景的必选项。在终端执行几行命令即可完成安装,你可以自由选择模型提供商、自定义所有配置。本教程的主线以此方式展开。
云端托管:阿里云、腾讯云、火山引擎等国内云厂商提供 OpenClaw 托管服务,省去安装配置的麻烦,但灵活性较低。
Docker 部署:适合生产环境,可实现环境隔离、版本管理、自动重启。详见第七章。
不想折腾安装?试试云端托管
如果你不想自己安装和配置:
- 飞书妙搭:一键创建,云端部署 + 自动接入飞书机器人,内置飞书官方插件,限时每日赠送百万级 Tokens
- ArkClaw:火山引擎 ArkClaw,需订阅 Coding Plan(Lite ¥9.90/月起,新用户 7 天免费试用)
本教程以本地安装为主线,因为这能让你完全掌控 OpenClaw 的配置和数据。云端托管的操作方式类似,学会后可以无缝迁移。
6.2 学习路径
学习 OpenClaw 分为三个阶段。第一阶段"领养 Claw"(1-2 周)主要是快速上手,学会安装、配置、基础命令,接入 Telegram 或飞书等移动端,安装和使用市场技能,创建定时任务和工作流。
第二阶段"深度使用"(2-4 周)会涉及更高级的功能,包括集成 Gmail、Calendar、Notion 等外部服务,配置多个模型(Claude、GPT、本地 Ollama),在 VPS 或 Docker 上部署生产环境,以及优化 API 费用。
第三阶段"构建 Claw"(4-8 周)是深入理解原理,从零实现一个简化版的 AI Agent。你会学习 Agent Loop 和工具调用的核心机制,技能系统的解析和加载,多渠道消息适配器的设计,以及工作区 Markdown 文件(IDENTITY.md、SOUL.md、USER.md、AGENTS.md、TOOLS.md、MEMORY.md、HEARTBEAT.md、BOOT.md、BOOTSTRAP.md)构成的记忆与身份系统。
6.3 注意事项
安全是第一位的。首次使用建议在测试环境,不要直接在生产数据上操作。谨慎授予文件系统权限,OpenClaw 可以读写你的文件,所以要确保它不会误删重要数据。定期审查 Agent 的操作日志,了解它做了什么。对于敏感操作(如删除文件、发送邮件),最好设置人工确认。
成本控制也很重要。设置 API 调用上限,避免因为 Agent 失控导致费用暴增。优先使用缓存和本地模型,可以大幅降低成本。监控 Token 消耗情况,了解哪些任务最耗费资源,针对性优化。
学习节奏要循序渐进。从简单任务开始(如天气查询、文件整理),逐步增加复杂度(如邮件管理、代码审查)。理解原理后再自定义技能,不要一上来就想做很复杂的东西。
7. The Future:未来展望
技术演进方向很明确。随着 Claude 4.6、GPT-5 等新模型的发布,OpenClaw 的推理能力会持续提升。多模态能力(图像、视频理解)会让它能处理更多类型的任务。更长的上下文窗口(1M+ tokens)意味着它可以一次性处理更大的项目。
协作模式也在演进。未来可能会出现 Agent 团队协作的模式,多个专业化的 Agent 各司其职,通过某种协议共享知识和状态。分布式任务执行可以让 OpenClaw 调度多台机器的资源,处理更大规模的任务。
使用门槛会持续降低。图形化配置界面可以让非技术用户也能轻松使用 OpenClaw。自然语言定义技能意味着你不需要写代码就能扩展它的能力。一键部署方案会让生产环境部署变得更简单。
生态系统方面,技能市场会走向成熟,出现数千个社区贡献的技能、企业级技能认证、技能组合推荐。企业级特性会包括团队协作与权限管理、审计日志与合规性、私有化部署方案。开发者工具链会提供 Agent 调试工具、性能分析器、技能开发 SDK。
OpenClaw 的崛起标志着三个重要趋势:AI 应用范式从"辅助决策"转向"自主执行",开源 AI 的社区驱动创新速度超越闭源产品,本地化 AI 让数据主权和隐私保护成为核心竞争力。正如 Peter Steinberger 所说:"OpenClaw 不是终点,而是起点。我们正在见证 AI Agent 时代的黎明。"
8. 开始你的旅程
OpenClaw 代表了 AI 发展的一个关键转折点:从对话到执行,从建议到行动。它不是完美的,有成本、有风险、有学习曲线。但它打开了一扇门,让我们看到 AI 可以成为真正的"数字员工",而不仅仅是聊天伙伴。
本教程分为两部分。"领养篇"帮你快速上手,把 OpenClaw 变成日常效率工具。"构建篇"带你从零实现,深入理解 Agent 的工作原理。无论你是想提升个人效率,还是想构建自己的 AI Agent 系统,这里都是一个好的起点。
让我们开始吧。🦞