Skip to content

अध्याय 7 हल्का समाधान: जब एजेंट "पतला होना" शुरू करता है

मुख्य प्रश्न: ओपनक्लॉ में कोड की 500,000 लाइनें हैं, लेकिन एक एजेंट के काम करने के लिए न्यूनतम कितनी लाइनें आवश्यक हैं?

1. हमें "वजन कम" क्यों करना चाहिए?

कल्पना कीजिए कि आप एक मोबिलिटी स्कूटर खरीदना चाहते हैं। ओपनक्ला एक लक्जरी आरवी की तरह है - इसमें एक रसोईघर, बाथरूम, शयनकक्ष है और इसमें एक परिवार रह सकता है। लेकिन कभी-कभी, आपको बस एक साझा बाइक की आवश्यकता होती है।

ओपनक्लॉ का "वजन":

  • टाइपस्क्रिप्ट कोड की लगभग 500,000 पंक्तियाँ
  • 53 प्रोफाइल
  • 70 से अधिक निर्भरता पैकेज
  • रनटाइम मेमोरी 1GB+

यह कोई कमी नहीं है, बल्कि एक डिज़ाइन विकल्प है। OpenClaw को 20 से अधिक चैट चैनलों, जटिल अनुमति प्रणालियों और एंटरप्राइज़-स्तरीय सुविधाओं का समर्थन करने की आवश्यकता है। लेकिन कई दृश्यों के लिए, यह बहुत भारी है।

जब आपको "वजन कम करने" की आवश्यकता हो:

🌡️ परिदृश्य 1: रास्पबेरी पाई पर रनिंग एजेंट आप 30 युआन रास्पबेरी पाई पर एक स्मार्ट होम असिस्टेंट बनाना चाहते हैं। 512MB RAM के साथ, OpenClaw को प्रारंभ करना भी कठिन है।

📚 परिदृश्य 2: सीखने के सिद्धांत आप समझना चाहते हैं कि एजेंट कैसे काम करता है। कोड की 500,000 लाइनों का सामना करना पूरे बोइंग 747 का अध्ययन करके एक हवाई जहाज के यांत्रिकी को समझने की कोशिश करने जैसा था - यह बहुत जटिल था।

परिदृश्य 3: सरल आवश्यकताएं आप बस यह चाहते हैं कि एजेंट आपको दिन में एक बार पानी पीने की याद दिलाए और एक साप्ताहिक रिपोर्ट संकलित करे। 20 चैनलों की कोई आवश्यकता नहीं, जटिल उद्यम सुविधाओं की कोई आवश्यकता नहीं।

इससे एक दिलचस्प सवाल उठता है: एक एजेंट के लिए न्यूनतम आवश्यकता क्या है? **

2. तीन "वजन घटाने की सफलता की कहानियाँ"

आइए तीन सफल "वजन घटाने" कार्यक्रमों पर नजर डालें:

प्रोजेक्टभाषाकोर कोडमुख्य विशेषताएं
नैनोक्लॉटाइपस्क्रिप्ट~7,000 पंक्तियाँएकल प्रक्रिया + कंटेनर अलगाव
नैनोबोटपायथन~4,000 पंक्तियाँरिसर्च फ्रेंडली + एमसीपी
ज़ीरोक्लॉजंगअज्ञात<5MB 内存

它们走的路线完全不同,但都保留了 Agent 的核心能力。

2.1 NanoClaw:用容器"隔离"复杂性

作者的想法:"OpenClaw 有近 50 万行代码、70+ 依赖。我可不敢把看不懂的代码全权托付给生活。"

NanoClaw 的解决思路很直接:既然控制权限很复杂,那就干脆隔离起来

核心设计:

① 单进程替代分布式 OpenClaw 有 Gateway 作为控制平面,功能模块之间通过 WebSocket 通信这很灵活,但也复杂。 NanoClaw 就一个大循环:轮询 SQLite 数据库 → 发现新消息 → 启动容器处理 → 返回结果。没有复杂的网络服务间通信,容器通过文件系统 IPC 与主机交互。

② 容器隔离替代权限配置 OpenClaw 靠应用层的配对码和允许列表进行访问控制,Agent 直接运行在主机上。这是应用层权限,配置复杂,还可能出漏洞。 NanoClaw 直接把 Agent 扔进 Docker 容器。Agent 能访问什么,完全看容器挂载了什么目录。这是操作系统级的隔离,简单且安全。

③ Skills 按需添加 NanoClaw 核心代码不包含任何渠道(Telegram、WhatsApp 等)。需要什么,用 Skills 安装: @@@000000@@@ 每个人的 NanoClaw 都是"私人定制",没有多余包袱。

实际用起来: @@@000001@@@

对话时用触发词 @@@000007@@@: @@@000002@@@

NanoClaw 的特色功能:

  • Agent Swarms:多个 Agent 协作完成任务
  • 每个群组独立记忆:每个聊天群组有自己的 CLAUDE.md
  • 定时任务:内置调度器

适合谁? 想要一个可控、可理解、安全的私人助理。

2.2 Nanobot:Python 党的"教科书"

如果说 NanoClaw 是用容器隔离复杂性,Nanobot 则是用清晰的代码结构让复杂性变得可理解。

项目背景:香港大学数据科学团队(HKUDS)开发,"比 OpenClaw 少 99% 代码,但核心功能都在"。

核心数据:

  • 约 4,000 行 Python 核心代码
  • Agent 核心逻辑(loop.py)约 500 行
  • 支持 Python 3.11+
  • PyPI 直接安装:@@@000008@@@

Nanobot 的设计哲学是"显式优于隐式"。每个功能都写在明处:

Agent 循环(核心逻辑):

  1. 从消息队列接收消息
  2. 构建上下文(系统提示词 + 历史记录 + 记忆 + Skills)
  3. 调用 LLM
  4. 执行工具调用
  5. 返回结果

代码结构清晰得像教科书: @@@000003@@@

多渠道支持: Telegram、Discord、WhatsApp、飞书、钉钉、Slack、QQ、Email、Matrix。配置文件简单直接: @@@000004@@@

MCP 支持(亮点): Nanobot 原生支持 Model Context Protocol,可以连接外部工具服务器。比如文件系统 MCP: @@@000005@@@

适合谁? 想理解 Agent 原理的开发者、研究者。

2.3 ZeroClaw:把"轻"做到极致

如果 NanoClaw 是"精简",Nanobot 是"清晰",那 ZeroClaw 就是把"轻"做到了极致。

团队:哈佛、MIT、Sundai.Club 社区联合开发。

数字说话:

指标OpenClawNanoClawNanobotZeroClaw
内存>1GB~100एमबी~100एमबी<5एमबी
वॉल्यूम~28एमबी~100एमबीएन/ए~8.8एमबी
लागत$599 मैकसामान्य सर्वर~$50$10 हार्डवेयर

**इसे कैसे करना है? ** ज़ीरोक्लॉ को रस्ट में लिखा गया है और एकल बाइनरी में संकलित किया गया है। कोई Node.js रनटाइम नहीं, कोई Python दुभाषिया नहीं, बस शुद्ध मशीन कोड।

वास्तुकला डिजाइन: ज़ीरोक्लॉ विशेषता (विशेषता) संचालित वास्तुकला का उपयोग करता है। इसे "क्षमता इंटरफ़ेस" के रूप में समझा जा सकता है:

  • प्रदाता विशेषता: जब तक यह इंटरफ़ेस लागू है, आप किसी भी एलएलएम से जुड़ सकते हैं
  • चैनल विशेषता: जब तक यह इंटरफ़ेस लागू है, आप किसी भी चैट चैनल तक पहुंच सकते हैं
  • टूल विशेषता: जब तक यह इंटरफ़ेस लागू है, कोई भी टूल जोड़ा जा सकता है

इसका मतलब है: अन्य भागों को प्रभावित किए बिना सभी घटकों को बदला जा सकता है

निर्माता स्वतंत्र: ज़ीरोक्लॉ किसी एआई विक्रेता से बंधा नहीं है। ओपनएआई, एंथ्रोपिक, डीपसीक, मूनशॉट, जिपु, वीएलएलएम, ओलामा... को सपोर्ट करता है और इसे एक क्लिक से भी स्विच किया जा सकता है।

हार्डवेयर समर्थन (अद्वितीय लाभ): ज़ीरोक्लॉ सीधे एम्बेडेड डिवाइस पर चल सकता है:

  • रास्पबेरी पाई
  • ईएसपी32
  • STM32 विकास बोर्ड
  • विभिन्न GPIO परिधीय

इसका मतलब यह है कि एजेंट भौतिक दुनिया को सीधे नियंत्रित कर सकता है: सेंसर पढ़ना, मोटरों को नियंत्रित करना, एलईडी जलाना।

**यह किसके लिए उपयुक्त है? ** एंबेडेड डेवलपर्स, लागत-संवेदनशील परिदृश्य, और उपयोगकर्ता जो क्लाउड विक्रेताओं पर भरोसा नहीं करते हैं।

3. मुख्य व्यापार-बंद: क्या "घटाया" गया है?

"वजन कम करना" कभी मुफ़्त नहीं होता। जब आप किसी एजेंट को कोड की 500,000 पंक्तियों से कुछ हज़ार पंक्तियों तक सीमित करते हैं, तो कुछ का त्याग करना पड़ता है। मुख्य बात यह है: **क्या ये बलिदान सार्थक हैं? **

निम्नलिखित तालिका मुख्य कार्यों के संदर्भ में तीन परियोजनाओं के बीच व्यापार-बंद का सारांश प्रस्तुत करती है:

कार्यात्मक आयामओपनक्लॉनैनोक्लॉनैनोबोटज़ीरोक्लॉ
वास्तुकलावितरित, क्षैतिज रूप से स्केलेबलएकल प्रक्रिया + कंटेनर अलगावएकल प्रक्रिया प्रतिरूपकतासिंगल बाइनरी
अनुमतियाँएंटरप्राइज-ग्रेड आरबीएसीकंटेनर अलगाव ("सेल" मोड)सरल श्वेतसूचीयुग्मन कोड + अनुमति सूची
चैनलबिल्ट-इन 20+कोर जीरो चैनल, मांग पर स्थापित कौशलमल्टी-चैनल, सक्षम करने के लिए कॉन्फ़िगर किया गयाविशेषता समर्थन, डिफ़ॉल्ट सीएलआई
स्मृतिवेक्टर डेटाबेस + स्वचालित एम्बेडिंगप्रत्येक समूह CLAUDE.md सादा पाठSQLite बुनियादी खोजस्व-विकसित SQLite + FTS5 + वेक्टर
विस्तारडायनामिक प्लग-इन + हॉट अपडेटकोई प्लग-इन नहीं, सीधे कोड बदलेंएमसीपी बाहरी उपकरणविशेषता प्रतिस्थापन, पुनः संकलित करने की आवश्यकता
निर्भरताएँ70+ पैकेजएकल-अंकीय कोर निर्भरताएँपिप वैकल्पिक स्थापनासंकलन के बाद शून्य निर्भरता

व्यापार-विनिमय के तीन अलग-अलग दर्शन

नैनोक्लॉ: प्रबंधन को अलगाव से बदलें

जटिल अनुमति नियमों को कॉन्फ़िगर करने के बजाय, एजेंट को सीधे कंटेनर में डालना बेहतर है। "क्या किया जा सकता है" माउंट निर्देशिका द्वारा निर्धारित किया जाता है, कॉन्फ़िगरेशन फ़ाइल द्वारा नहीं। यह सुरक्षा का "डिफ़ॉल्ट अविश्वास" दृष्टिकोण है - मैं आपकी निगरानी नहीं करूंगा क्योंकि आप पिंजरे से बच नहीं सकते

नैनोबोट: व्यापक के बजाय स्पष्टता का उपयोग करें

कोड एक पाठ्यपुस्तक की तरह है, प्रत्येक फ़ंक्शन स्पष्ट रूप से लिखा गया है। सबसे पूर्ण फ़ंक्शन के लिए न पूछें, बल्कि एक नज़र में आसानी से समझने के लिए कहें। यह एक "समझदारी पहले" डिजाइन अवधारणा है - मैं चाहता हूं कि इसमें कम फ़ंक्शन हों, लेकिन मैं आपको यह भी समझाऊंगा कि कोड की प्रत्येक पंक्ति क्या कर रही है

ज़ीरोक्लॉ: यूनिवर्सल को अल्टिमेट से बदलें

<5एमबी मेमोरी, एकल बाइनरी, शून्य रनटाइम निर्भरता। यह "संसाधन दक्षता पहले" इंजीनियरिंग परिप्रेक्ष्य है - मैं चाहता हूं कि एजेंट 10 युआन हार्डवेयर पर चले

एक मूल अंतर्दृष्टि

हल्का समाधान "कोनों को काटने" के बारे में नहीं है, बल्कि प्राथमिकताओं को फिर से परिभाषित करने के बारे में है:

  • उद्यमों के लिए, अनुपालन, विस्तार और टीम वर्क पहली प्राथमिकता है → OpenClaw चुनें
  • व्यक्तियों के लिए, सरलता, नियंत्रणीयता और पर्याप्त उपयोग पहली प्राथमिकता है → हल्का समाधान चुनें

यह एक मोबाइल फोन खरीदने जैसा है: एंटरप्राइज़ संस्करण में एमडीएम प्रबंधन और सुरक्षा सख्त है, लेकिन व्यक्तिगत उपयोगकर्ताओं को केवल मूल संस्करण की आवश्यकता हो सकती है - पतला, हल्का, बिजली की बचत करने वाला और सस्ता।

**एजेंट का मूल मूल्य कई कार्य करने में नहीं, बल्कि सही होने में निहित है। **

4. मॉडल चयन पर सुझाव: आपको किस "कार" की आवश्यकता है?

你的需求是什么?

    ├─→ "我想搞懂 Agent 原理"
    │       └─→ Nanobot(Python,代码像教科书)

    ├─→ "我要一个私人助理,安全可控"
    │       └─→ NanoClaw(容器隔离,AI-native)

    ├─→ "我要在树莓派/嵌入式设备上跑"
    │       └─→ ZeroClaw(<5MB 内存)

    ├─→ "我需要 MCP 协议支持"
    │       └─→ Nanobot(原生 MCP)

    └─→ "我要生产环境,功能最全"
            └─→ OpenClaw(20+渠道,生态完善)

5. सारांश: जो सबसे उपयुक्त है वही सर्वोत्तम है

तीनों परियोजनाओं ने तीन अलग-अलग रास्ते अपनाए:

  • नैनोक्लॉ: जटिलता को अलग करने के लिए कंटेनरों का उपयोग करें, और मांग पर कौशल जोड़े जाते हैं
  • नैनोबोट: स्पष्ट कोड के साथ जटिलता को समझने योग्य बनाएं, एमसीपी का समर्थन करता है
  • ज़ीरोक्लॉ: संसाधन उपयोग को अधिकतम करने और हार्डवेयर का समर्थन करने के लिए रस्ट का उपयोग करें

वे एक बात साबित करते हैं: एजेंट को काम करने के लिए कोड की 500,000 लाइनों की आवश्यकता नहीं है

बेशक, इसका मतलब यह नहीं है कि ओपनक्लॉ खराब है। यह एक कार खरीदने जैसा है: कभी-कभी आपको एक एसयूवी (ओपनक्लॉ) की आवश्यकता होती है, कभी-कभी एक बाइक पर्याप्त होगी (लाइटवेट सॉल्यूशन)। मुख्य बात सही उपकरण चुनना है।