我让 OpenClaw 🦞 为我当 OP


正如我在 为 OpneClaw 增加 Browser 工具 中提到的那样:

在整个的部署过程中,遇到了太多的坑,每遇到一个坑,我就让 Gemini 帮我解决。

突然,我意识到:目前 LLMs 对于 Linux 系统的理解应该比人类要强得多,对 Linux 系统的各种命令操作也应该比人类要强得多。

既然如此,为什么不让 OpenClaw 帮我解决 Linux 系统的运维呢?恰好,我有一个 3 台机器的小集群,每天都要登录上去做一些手工操作,我不想再这样继续下去了。我想做出一些改变,于是,我决定让 OpenClaw 来当 OP,帮我管理集群。我要做的就是:通过 IM 下发指令。

1. 搭建集群

说干就干,LFG,🦞。

于是,我又找了一台机器作为 Manager Node,并且在 Manager Node 安装了 OpenClaw。然后,我为我的 IM 配置了 OpenClaw 的 Webhook,这样,我就可以通过 IM 发送指令给 OpenClaw。最后,通过 ssh-copy-id 命令,在 Manager Node 上配置了 Worker Node 的免密登录。

于是,我的 🦞 看起来是如下的样子:

现在,我们可以让 🦞 帮我管理集群了,比如我要查看 Node-1 机器的 CPU 负载信息,🦞 就会在 Manager Node 上执行如下的命令,并返回结果。

1
ssh user@Node-1 "uptime"

2. 告诉 🦞 如何管理集群

我希望 🦞 可以知道它现在可以管理的机器列表,并且当有新的机器节点加入集群时,🦞 也能够知道如何处理新增加的机器。于是,我通过 IM 把这些知识以聊天的方式告诉了它:

1
2
3
4
5
6
悟空,你现在可以在受信任的机器上通过给定账号执行命令,从而实现集群管理的目的。
但是现在有个问题:别人不知道究竟有那些收信任的机器可以管理,
所以你需要通过配置的方式把受信任的机器和账号以username:host的格式存储起来。
当别人问你类似:你可以管理哪些机器的时候,你就从这个配置里告诉他就可以。
当别人让你在某个 host 上执行命令时,如果不提供 username,那么就默认用配置中的配置的用户执行。
把这些内容存入你的记忆中,永远记下来。

看起来,一起都非常的完美。现在,🦞 已经知道如何管理集群了,同时它也确实具备了管理集群所需要的所有的能力了。

不用担心 OpenClaw 的能力

不用担心,🦞 是否能够听懂我们的 自然语言 指令 ,或者担心它无法翻译成合适的 Linux 命令。实际上,这种担心是多余的。

如今的 LLMs 已经不是 2023 年的 LLMs 了,它们已经可以理解自然语言,它们已经对 Linux 系统了如指掌了。反正每次遇到系统的坑,我都会让 Gemini 帮我解决,我完全相信 🦞 的能力。

如果我们也不知道,而恰巧 LLMs 也不清楚,那么我们就亲自弄明白然后告诉 🦞 吧,相信它记得会比我们更牢固。

3. 测试 🦞 的集群管理能力

现在,我想知道我的集群中的机器的负载情况。之前,我必须登录到每台机器上,然后执行 uptime 命令。好麻烦。即便是在中控机执行命令,我也得手动写命令。

现在,我不需要登机器、甚至不需要登中控机,我只需要打开 IM 并告诉 🦞:

查看下这三台机器的cpu负载,并进行对比分析。务必简要,可以用表格来呈现。

就可以了,剩下的所有的事情,🦞 都会自动完成。

4. 安全风险的思考

赋予 AI root 权限,是一件便利但是却极其危险的事情。就像 Elon Musk 的 推文 中描述的那样:

Giving people agentic AI be like …

在实践中,当 OpenClaw 为我们提供便利的同时,我们必须严格控制安全风险,务必采用最小权限原则:
绝对不要直接让 OpenClaw 使用 root 权限,更高级别的权限,必须掌控在我们自己手中。创建一个专用的 openclaw_ops 用户,只赋予其执行特定运维命令的 sudo 权限。尤其是对于像 rm -rf / 这样的毁灭性命令,必须物理禁止。

好在是,我们总会有办法来控制 OpenClaw 的权限,只要我们想这样做。

我们不能因为担心风险而放弃使用 OpenClaw,而是应该想尽办法来控制风险。

5. 理想的未来

3 台机器的集群虽小,但它却验证了一个宏大的架构路径。基于 GitOps 和 Agentic Memory 的理念,我们完全可以对未来做进一步的畅想:

  • 分布式联邦记忆(Distributed Federated Memory):
    在更大的团队中,可以有多个 OpenClaw 实例在不同的数据中心或业务集群中工作。它们可以通过 GitOps 架构,定期将自己的本地记忆 Push 到同一个中央 Git 仓库,并 Pull 其他 Agent 的新记忆。通过大模型的 语义融合(Semantic Fusion) 能力,实现整个组织经验的全局共享和异地演进。

  • 从 Passive Ops 到 Proactive Ops:
    未来的 OpenClaw 将不再是被动等待指令或告警,而是可以通过连接 Prometheus 等监控系统实时分析性能趋势。在磁盘空间即将耗尽前,它能主动根据沉淀的 SOP 执行无害日志清理;在业务高峰来临时,它能自动根据历史经验执行云端扩容操作……

  • 沉淀团队真正的灵魂:
    服务器硬件和模型肉体都是暂时的,唯有在一次次碰撞和纠错中沉淀下来的版本化知识,才是个人、团队、组织的灵魂。当新成员加入团队时,他们不再需要翻阅过时的文档,只需要坐在 OpenClaw 旁边,OpenClaw 会带着团队所有的历史经验,辅助他完成新的任务。

打赏
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2020-2026 Wang Wei
  • 本站访问人数: | 本站浏览次数:

请我喝杯咖啡吧~

微信