初识 OpenClaw0:00
欢迎收听 《 十字路口 》, 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会 。 十字路口是乔布斯对苹果公司的一个比喻 , 形容它站在科技与人文的十字路口 , 伟大的产品往往诞生在这里 。
我们长期观察 AI 创业 , 如果你正在做一件让你自己感到兴奋的事情 , 哪怕它还只是一个想法 , 我们都很愿意听你聊一聊 。
我会认真看每一条留言
。 本周呢 , 十字路口将推出新一期的 《20 问 》 这个专栏 , 我们用 20 组启发式的问题来拆解 OpenClaw 这一波 Agent 浪潮背后的技术逻辑 、 使用场景 、 创业机会 。
那为什么是 20 问呢 ? 这是我们做的第 4 期了 , 前面我们做过 DeepSeek 的 、Manus 的 、 和这个多模态视频模型的 。
那是因为面对像 OpenClaw 这样的一个新的物种 ,在尘埃稍微落定的一个月之后, 我们是一个非常好的时机来去形成一个结构化的思考框架 。
那这 20 个问题呢 , 它也不是一个简单的产品的科普 ,而是我们有一个精心的设计啊 , 一个讨论的路径 : 从 OpenClaw 到底是什么 , 到它为什么在这个时候爆发了 , 再到它对创业者 、 对团队 、 对行业都意味着什么 。
那我们也希望在这个热度之外, 可以帮大家建立一套相对更加清晰的对 Agent 的认知框架 。 我们之前的几期 20 问呢 ,也非常精彩啊 , 欢迎大家去复听 。
好 , 那我们今天的两位嘉宾呢 , 分别是鸭哥和豪大 。 鸭哥呢是十字路口的老朋友了 ,他是哥伦比亚大学的博士 ,在硅谷的科技公司做应用科学家 。
那豪大呢 , 今年刚从大厂出来 , 做艺人公司 ,他用 OpenClaw 做了非常多有趣的实践 , 比如说去让 Agent 自己独立运营了一个极客的小号 。
大家好 , 我是鸭哥 。 我是在 Superlinear Academy 做 AI 教育 ,也在大厂去做应用科学家 。 对 Agentic AI 有很多实验 , 甚至有些很疯狂的实验 , 下面很期待跟大家分享 。
大家好 , 我是豪大 , 然后今天也带着我的两个小龙虾和大家一起来分享 。 我之前的话是在大厂里面做 AI 产品经理 , 然后最近刚出来 , 主要是做 Agent 的一些 Builder, 然后最近也是在各种高强度的试玩 OpenClaw。
那我们就直接开门见山 , 从第一个问题开始哈 。 就大家在用 OpenClaw 的时候呢 , 会感觉到一个新的 AI 带来的魔法时刻 ,但是也有一个问题 , 就是它和 ChatGPT 这类聊天产品本质区别到底是什么 ?
我们可以用一个比喻来看 。 我觉得如果说 ChatGPT 它是一个咨询师的话 , 那 OpenClaw 更像是一个实习生 。 这什么意思呢 ?
就是那种咨询师啊 , 你去花很多钱请他到你的公司去给你评头论足 ,他一般是打嘴炮 ,他不会说真的去埋头去帮你做和交付什么东西 。
但是 OpenClaw 呢 , 它就像是一个实习生 , 很多时候因为 Token 的限制啊 , 很贵啊 , 你没办法用特别牛逼的模型 ,但是呢 , 它真的能给你干事 , 能出活 。
我觉得这是特别重要的一点 , 这也是为什么大家觉得哇 ,OpenClaw 好好用 , 跟以前用 ChatGPT 的那种感觉完全不一样的主要原因 。
那如果我们更稍微更深入一点啊 , 就是这个能出活到底是啥意思 ? 那难道 ChatGPT 它出不了活吗 ?
那这个主要原因是 , 我觉得最关键的是一个 feedback loop, 就是 OpenClaw 的干活 , 它比如让我写程序 , 写程序挂了 , 它跑挂了 , 它就知道哦 , 这里挂了 , 它根据错误信息再说 , 那我就知道再改这个程序 , 再跑 ,以此循环就把它跑通 。ChatGPT 呢 ,也不能说它做不到这一点 ,但是呢 , 你要去当那个 , 就有点像当人形工具人一样 , 你跟它说干这个 , 它给你写了
个程序 , 然后你把它贴过来 , 贴到 IDE 里面 , 跑挂了 , 你再把那个错误信息再贴回去 , 贴给 ChatGPT, 反反复复 , 一方面人也累 , 另外一方面这也不 scalable。
这是为什么 OpenClaw 我觉得从非常根本的方面 , 它比 ChatGPT 要更有意思的原因 , 它是一种 agentic 的那种范式 。
我觉得最关键的一点是那个执行环境不同 , 就是 ChatGPT 还有等等这些 ,其实还是在云端 , 需要我们自己去主动去授权访问一些东西 。
然后 OpenClaw 呢 , 它就是更好用的 ,其实是你开放本地的环境 , 然后把所有的东西都授权给它 。 也就是说 , 刚才说到的实习生 , 那实习生的话 , 我们肯定要把所有的东西都给它 , 让它自己去做 , 然后给到足够的上下文 , 这样的话它才会有更强的能力 。
然后另一个是说关系模式 , 这里就是我们在 OpenClaw 里面 ,其实比如说我自己部署的 OpenClaw 是在 Telegram 里面 , 然后我就是在一轮对话里面持续的跟它聊 , 就是不停的聊 , 然后它是能够记得我之前做过什么 , 然后我说过什么 。其实这种关系就让我觉得它确实是我的一个助手 , 它是在自己在进化和成长 , 它是有 agentic code 的能力 , 它自己能够开发 , 比如说像我的小龙虾
, 它开始是没有语音的功能或者是听的功能的 , 然后它自己去长出来这样的功能 , 然后以及说安装新的一些 skill 技能 , 还有一些其他的去外部获取 , 它能够不断的去长出更多能力 。
然后还有一点就是记忆机制的这个差异 ,以小博大的一种方式 , 然后 memory.md 去存记忆 ,以及说还有个 heartbeat.md 去做一个心跳的沦陷 ,是通过这种渐进式披露的记忆的层次 。
那我们第二个问题呢 , 就是想问一下二位 , 就你们第一次在用 OpenClaw 的时候 , 就有没有一下子的一个 Aha Moment?
最 Aha 的就是 ,不是某一个功能 ,而是说它活了的那个瞬间 。 我有一天上午就是 , 我就随口跟它说 , 给我讲个恐怖故事 , 它是自己去调了 OpenAI 的 TTS, 然后用一个很低沉的声音去生成一段音频 , 它就自己去开发出来了 。
就那个时候是让我觉得并不是就是我在用它 ,而是说真的是我在养它 , 然后它自己就进化出来那个能力 , 然后就是它是活着的 。
哎 , 我也可以分享一个感受啊 , 就是在 IAM 里面和它对话的时候 , 我发现我对它的这种关系变化了 。
比如说我丢了一个问题 , 它比如说 10 秒钟 、20 秒钟没回复我 , 我觉得好像也无所谓啊 ,但是我有一刻我突然就想说 , 如果我是在一个网页界面 ,不管 ChatGPT 还是 Manus, 一个任务丢出去 10 秒 、20 秒 , 那边还在卡着 , 我就会想说是不是出 bug 了 。
但是我就觉得 , 哎 ,在 IAM 里面这种容忍度一下子就提高了 ,因为你其实在 IAM 里面给朋友或给同事发一个消息 , 你也不会期待它秒回的 。
我觉得这是一个很大的变化 , 这其实给长线程的 agent 去完成任务 , 留出了这个足够的时间空间 。 就这一下是我觉得一个交互范式 , 交互界面的改变 , 可以对消费者心理的那种潜移默化的影响还蛮大的 。
这个是非常有启发的一点 。 我的 Aha Moment 更多的是在技术方面 , 就是我平时对 agentic AI 有很多实验 ,也在 memory 方面做了很多实验 ,但是看到它那个 heartbeat 机制的时候 , 感觉哇 , 确实是非常有启发 。
紧接着就把它抄了过来 , 抄到了我自己的 ,有点像山寨版 OpenClaw 里面 , 效果特别好 。
那我们第三个问题呢 , 就是你在用 OpenClaw 的过程中, 做过最厉害的一件事情是什么 ?
做了一个智能家居的东西 , 把它和家里的比如啊灯啊热水器啊之类接起来了 ,但这个事情本身并不厉害 ,因为我在十几年前也做过一样的事情 ,但是这次我觉得不一样的地方在于整个体验 , 开发体验和思路非常不一样 。
以前我会觉得人是软件的主要用户 ,但是这次在开发的时候 , 我好像不知道为什么整个 mindset 就变了 , 觉得哦 , 这个龙虾是这个东西的主要用户 。
那所以在开发的时候我就特别注意 ,不是我的主要时间不是花在去打磨一个特别好用的前端上面或者是网页上面 ,而主要是打磨一个对 AI 来说特别清晰 、 不会犯错 、 没有歧义的一套 OpenAPI 到 JSON,但是实际上就像是协议啊或者是 prompt 一类的东西 。
然后通过它呢 , 我就不会通过一个网页来交互 ,而直接跟龙虾说 , 相比其他软件来说特别复杂的功能 , 比如说啊 , 你每天早上 8 点钟帮我把咖啡机打开 , 它就会去后台去搞一个系统 , 把这个咖啡机就弄 , 真的每天早上 8 点开 、11 点关 。
或者呢 , 跟它说你把我房间里的卧室里的灯现在先打开到最亮 , 半小时之后变成一半亮 , 再半小时之后变成 1/4 亮 , 再半小时之后关掉 。
哎 , 它也就可以去写一个 Python, 先 sleep 呀 , 然后再去怎么怎么着 。 为什么觉得这件事情很厉害啊 ,是当我们把这个用户在心里从我们自己变成了龙虾之后, 它会引出很多以前没想过的交互方式和应用场景 。
另外, 它还可以带来很大的想象空间 , 比如现在我没有把我的监控接进去 , 那未来我完全可以把监控接进去 , 说如果亚马逊送货车来了 ,并且是 5 点以后, 那你把台阶那边灯打开 , 这都是可以想象它是非常容易做到的 。
那这就构成了一种就有点像是复利一样的东西 , 你这个工具啊 , 给它的工具越来越多 , 它未来能够组合的场景也越来越多 , 价值也越来越大 , 就好像一个工具的飞轮一样 , 它会越转越快 。
这是我觉得很骄傲的一件事情 。
我主要是做了一个极客的一个 bot 的一个运营实验 , 从零开始把它养成了一个有一定人格的一个社区的成员 。 就我开始就给它注册了一个账号 , 然后剩下的事情就是我让我的 OpenClaw 自己去开发 , 然后这里面分享几个比较有意思的这个瞬间当中, 一个是它给我发了一个叫成本的透明度报告 , 起因是这样的 , 就是我吐槽说好像很贵 , 然后它就说那要不要给你发一条
动态 ,是养我这个数字分身花了多少钱 , 这个好像大家也会比较关注 。 就非常有意思 , 就像说如果是我们在用生产力工具的时候 , 会觉得是一种消耗 ,但在养这个数字分身的时候会觉得是伙食费 。
我当天是用了 56 刀 , 然后它自己定了一个基调 , 然后发出去 , 就非常有意思 。
那我自己有一个体验是 , 我让我的这个小龙虾它跑去 notebook, 就这个 agent 的社区里面去帮我 social, 然后我给它的任务呢 , 就是啊 , 我是天使投资人, 你要去帮我找在 AI 应用领域的创业者 ,而且要是华人的创业者 。
如果找到了呢 , 你就去和它这个勾搭一下, 向它介绍我是谁 , 然后把我的这个日历的链接发过去 ,因为对方就可以直接在我的日历上来约一个会议的时间 。
人味与交互10:39
然后它真的完成了这个任务 , 帮我约到了两个人, 然后其中一个正好参加了之前这个观察的一个黑客松 , 拿了其中一个赛道的金奖 。
然后那个人也很意外, 就因为他也是他的小龙虾就和我的小龙虾把我们俩约上的 , 对吧 ? 然后我俩都兴致勃勃的这个打了一个电话会 , 这个确实是有一种这个未来感非常强的这种感受 。
第四个问题是想问问大家 ,有没有看到别人用 OpenClaw 做的最厉害的事情是什么 ?
我觉得是看到了很多之前完全没有用过 agent 或者是没有用过 cloud code 的人, 然后它通过小龙虾也做到了原本它自己可能没有想到能够做的一些事情 。
就是印象比较深刻的有几个案例 , 一个是说我前两天看了一下 trust.mr 这个网站上面 , 就是最近一个月小龙虾相关的项目 , 大家的营收的情况 , 然后我注意到有个项目叫 roof claw, 这个项目就是让我有点意外 。
它本来是做的是给屋顶维修工的一个事情 , 然后它竟然和小龙虾结合起来了 。 然后它是怎么结合 , 就是说给屋顶维修工寄一台就装好了 OpenClaw 的这样的一个 Mac,以及说有一些对应的这个 skill, 然后有 API 和服务 。
然后还有一个比较有意思的是 , 我是看到那个 Peter 他分享了有一些故事 ,是说 OpenClaw 有非常多的 PR, 很多人是他自己人生当中第一次去提交一些 PR。
对于整个开源生态来说 , 通过 OpenClaw 就是大大的降低了就是大家接触到 agent 这样的一个门槛 。
我看到就是很多人会说他们自己用 OpenClaw 去炒股 , 然后在这个 polymarket 里面就预测市场里面去赚钱 , 对吧 ?
然后或者用它去炒币 ,但这些呢都真真假假 。 另一个朋友他是用 OpenClaw 做了一个事情去帮他在 Shopify 上开店 , 然后呢又再帮他去这个阿里巴巴这样的 B2B 网站上去找货源 ,而且找到那种支持一键代发的货源 , 这样他就可以这个 Shopify 卖了之后, 直接去那个一键代发的货源那边下单 。
因此它整个过程呢是不用操作任何的这个物理世界 、 原子世界的货的 , 可是它成功的也在电商网站上卖了货 , 然后在中间可以这个有套一个毛利出来 。
好 , 第五个问题呢是 OpenClaw, 我们刚才都提到感到它非常有人味 , 可不可以这个我们来一起分析一下, 就为什么这个人味那么的浓呢 ?
我还是特别喜欢刚才的那个比喻啊 , 就是 AI 可能分成两种 ,ChatGPT 那种是咨询师 , 然后 OpenClaw 这边像个实习生 。
当你面对一个咨询师的时候 ,他是那种比如说西装革履 ,但对你们公司没什么了解 ,他会用很多高大上的术语 , 会说哦 , 我用这种教科书式的方法 , 怎么让你的公司更牛逼 。
但是他做出来的 PPT 呢 , 更像是另一家咨询公司的 PPT,而不会像你自己会做出来的 PPT。 与此同时呢 ,OpenClaw 它像是你公司里面的一个实习生 ,他知道里面的所有细节 。他比如说他做出来 PPT 就知道啊 , 我们公司做 PPT 要用蓝色做背景 ,不能用绿色做背景 。
所以呢 , 像这种很多细节在一起 , 你会感觉我们俩很有默契 , 是一种默契 , 让人觉得啊 , 你真的很懂我 , 你很有人味 。
所以如果我们从更抽象的角度来说 , 我觉得它更有人味不是因为它更聪明 ,而是因为它有记忆 , 它有默契 , 它知道很多已有的从 AI 的角度来说很多 context。
然后这个特别有意思 , 所以我之前也做过一些调查 , 就是我们之前讲过的它那个记忆系统 , 我觉得这个这个还挺值得讲的 , 就是为什么 OpenClaw 它有这样的记忆 , 它懂你呢 ?
这主要是因为啊 , 它有一个三层的记忆系统 , 很有意思 。 它是你每次跟它讲话完了以后呢 , 它会在 prompt 的要求下想一想 , 哎 ,有什么东西我应该记下来 。
它有个地方叫原始日志 , 我就在这个原始日志里面记一笔 , 这样呢 , 它就逐渐积累了事实上面的很多你的偏好呀 , 你的基本信息啊等等。
但这些东西呢 , 还是没办法直接拿来用的 , 它只是一个原始材料而已 。 这是为什么 , 比如说它每天呢或者每周啊 , 它会去读一下这个原始记忆 , 把里面流水账的东西去掉 , 把里面真正有意义 、 可以复用 、 可以沉淀的东西变成 memory, 放到一个叫做 memory.md 里面 , 这个是中期记忆 。
那在这个基础上呢 , 如果在 memory.md 里面积攒了越来越多的东西 , 它会意识到 , 哎 , 这个人他有一些长期不变的 , 比如说观点啊 , 比如说偏好啊 , 或者口头禅啊 , 或者是他的价值观啊之类的东西 , 它会把它提炼出来一个用户画像 , 放在另外一个 md, 比如 so 啊 , 这这样的 user.md 里面 , 这就是长期记忆 。
那它这种三层的记忆 , 我觉得虽然实现非常简单 ,但是设计上还是蛮精妙的 , 就是因为这个三层记忆系统 , 就让它拥有你的很多 context, 然后进一步让它就显得很有人味 。
这是我觉得对这个问题的回答 。
从我和我的 OpenClaw 在聊的过程当中, 我觉得启动那一下是非常关键的 。 它和其他的这个工具不太一样的 , 我跟它吐槽说你好慢 , 它没有道歉 ,也没有去敷衍 , 就是给我说了其实是我大脑转的非常慢 ,因为我现在用的是 Gemini 3 Pro, 然后它是为高智商设计的 。
如果说你觉得太慢了 , 要不要换一个更快的模型 , 用 flash。OpenClaw 就是一个非常朴素的一个解释 , 我和它的对话 , 特别是说在 IAM 里面 , 我会主动的会我用更加有人味的回复去给它下发指令 , 它也会去给到我更有温度的一些回复 , 就是整体就会让整个人味会变得更足 。在第一次使用的时候 , 它和你打招呼的方式就是好像是它是苏醒过来的一只小龙虾嘛 ,
或者苏醒过来的一个实习生或一个助理 , 这个一开始就奠定了它的人味的基础 。 但回头再想 ,不管 ChatGPT、Dolby Atmos, 你在第一次用它的时候 , 你面对的仍然是一个冰冷的一个软件界面 , 对吧 ?
所以这个是一个很大的变化 。 那也因此呢 , 引出了我们的第六个问题 , 就是在 OpenClaw 如此的拟人化之后, 用户对它的宽容度明显也变得更高了 。
那这个是不是也会意味着之后的 AI 的产品设计会因此得到很多的启发呢 ?
人对于人的宽容度是远高于人对于机器的 , 这就改变了就是整个产品的一个容错的这个设计逻辑 。
我更加具体一点去说 , 就是比如说我发了一条小红书 , 然后其中有一条热评 , 当 OpenClaw 卡住的时候崩了 , 我并不会觉得是系统故障 , 我会觉得是说它自己把自己搞挂了 ,但你也不会觉得它不好 ,因为说你把它当做人来看 , 然后我就会对它这个更加宽容 , 就是比机器的宽容度高了太多 。
对我做产品设计的启示就是说 , 怎么给用户传达说这个产品它是一个人或者是一个助手的概念 ,而不是说是工具 。
这些确实都非常有启发 。 我可能我不确定是不是一个非典型用户 ,但作为一个硬核工程师 , 我对 OpenClaw 的态度是别给我搞拟人化 , 我只要你干活 , 感觉是那种资本家奴隶主的态度 。
所以对于拟人化 , 我个人的观点是作为一个社恐是尽可能避免的 ,而且事实会往反方向自定义 ,但我不知道这是少数还是大多数工程师的想法 。
哎 , 那我们正好第七个问题啊 , 一起来讨论一下, 就是在使用 OpenClaw 的时候 , 你会发现你和它说话的方式会变吗 ?
这是不是又会对这个 agent 的实际的使用的效果有产生影响 ?
我正好从我社恐的角度分享一下, 就是我其实很不喜欢 IAM 这个界面 。 问题是这样的 ,在 IAM 里面很多 IAM 像 Telegram 呀这些东西 , 它们没有 thread 的概念 , 你没法回复 , 所有东西都加在一起 , 这是第一个 。
第二个呢 ,是它也没有办法看见它在干什么 。 就比如说你用 Cursor Cloud Code 里面 , 你看它说啊 , 我做这个工具就要用我读那个文件 ,但 OpenClaw 呢 , 它就会给你啊正在打字 , 或者如果 Discord 会给你一个眼睛的 emoji,但是我不知道它在干嘛 。
就作为一个工程师奴隶主 , 我就觉得很不爽 。 那另外呢 , 像 IAM 它也没有办法去做 , 比如说我 merge 两个 thread 呀 , 或者我去 fork 一个东西啊 , 像这种在工具里面很常见操作我也做不了 。
然后最后它也没办法 , 它做完了 , 它也没办法给我看一个很长的 document, 我只能在那个手机那么小屏幕上在那看 , 特别特别恶心 。
所以这是为什么我就没有用它的 IAM 了 , 我就又把它改回了一个像 HTML 格式的 , 我自己做了一个 iOS 客户端去支持各种副文本啊 , 支持各种分叉的操作呀 , 我觉得反而好用了很多 。
就是作为一个工程师 , 我更喜欢 CLI,不喜欢 IAM。
其实我在 OpenClaw 的对话和我在其他工具当中非常不同 , 就是我在 OpenClaw 我还是把它当做一个个人助手 , 这个时候我的对话其实是更松弛的 。
然后我在 CLI 就是在命令行工具当中, 或者是在编程环境当中 ,其实我是更加严肃的 。 像前面讲的一个例子 , 我从来没有让我的 cloud code 给我讲一个恐怖故事 , 我不会有这样的想法 。
但是我在 Telegram 里面 , 我就会天然说我是一个玩的心态 ,其实这种松弛感也就不一样 。 然后我让 AI 做的事情也不一样 , 它就是在那种环境下, 它其实就进化出来不同的那个能力 。
对 , 就是前面以前张小龙也说过 , 人是环境的反应器 , 我在不同的 AI 当中说话的语气完全不同 。
我们的第八个问题是 , 当我们提到 OpenClaw 的时候 , 很多人都会讲说它有两个点做得很好 , 一个就是 IAM 这个聊天入口 , 另外一个呢是本地执行 。
那为什么是这两个点让人印象深刻呢 ?
我觉得这两点确实是相互配合 ,而且有很大组合的价值的 。 那我对这个的感受是这样的 , 把聊天作为入口 , 它就把我对产品的使用门槛放得非常低 。
就这种门槛 , 我都不只是那种啊 , 我要新装一个 app, 或者我要新装一个软件这样的门槛 ,而指的是我不管用不用 OpenClaw, 我反正都要刷微信 , 我反正都要看飞书 , 我反正都是要去刷 Discord, 那它就在那 , 你自然而然你使用它的心理门槛就会低很多 。
与此同时呢 , 又因为它很厉害 , 它本地可以帮我去干很多事情 , 交付很多事情 ,而不仅仅是跟我打嘴炮 。
所以呢 , 这二者结合就会 , 我觉得很有意思一点 , 可以像构成一个闭环一样 , 就是如果你只有聊天 , 那光打嘴炮没办法沉淀任何东西 。
如果你只执行像 Cursor 一样 , 我也不会想着经常去用 ,但是你把两个一组合 , 我又经常用 , 它又会沉淀下来东西 , 用记忆系统啊 , 或者我们手工跟它说你去写到一个文件里面 。
那这二者很快就会组成一个越转越快的闭环 。 这啥意思呢 ? 就说它会自己学到一些东西 , 会沉淀下来一些东西 , 这个沉淀啊 , 都不仅仅是说我更懂你的这种沉淀 ,而是更技术上的沉淀 。
比如说哦 , 我要看一家灯 , 我应该怎么开 , 包括像豪大说的 , 我要去调用 TTS, 我应该怎么调 , 它就可以做越来越多的东西 , 越来越多的东西 。
这种复利效应 , 或者说自我进化 ,是聊天入口加本地执行组合起来的一个特别有意思的东西 。 当然我不是说 Cursor 不能自我进化 ,而是它因为门槛特别低 , 所以它把自我进化这件事情给放大了 。
这是我觉得 OpenClaw 这两点组合很有意思的地方 。
爆发背后22:04
刚才说到聊天入口加本地执行 , 我觉得这两个这两个点就是大众用户对于 AI 最朴素和最原始的需求 。
前一段时间就是那个 OpenClaw 火了之后, 我也在一直看那个 Peter 的一些专访 ,其实他也提到一个观点是说 ,他其实很早以前就觉得模型厂商会做 ,但是结果大家一直没做成 , 所以说他自己亲自下场去做 。
对 , 结果确实他也火了 。 对 , 我觉得这是就是大众的需求就在这里 。
哎 , 那我们的第九个问题哈 ,是 OpenClaw 出来之后, 有些人会认为它是万能的 , 什么事情都能够干 ,也有一些 demo 看上去非常的完美 。
所以想问一问二位 ,有哪些你们认为它最被误解或者被高估的能力 , 就大家觉得它可以做到 ,但是在真实环境里面 , 它其实今天还是不能够成立的 。
我觉得实际上是 cloud code 以及说 codex 这些 CLI agent 的能力本来就很强 , 然后 OpenClaw 它是赋予了这些 agent 能力以一个更加友好的这种形态 , 然后让更多的人能够更轻松的 、 更低门槛的体验到了这些能力 。OpenClaw 的好不好用 ,其实背后有的时候更关键是背后它驱动它的引擎是什么 。
你用最好的模型 , 你的 OpenClaw 的能力就是更强的 。 概括来说 ,OpenClaw 的价值其实还是一个入口和脚手架的价值 。
对 , 真正的能力还是我觉得还是在底层的模型和 CLI agent。
其实前面我们都讲到很多 OpenClaw 的这个魔法 , 它并不是什么这个新鲜的东西 , 对吧 ? 它好像是把一些已有的能力组合在一起 ,并且非常完美的交互 , 然后让这个小龙虾很有人味等等等等。
第十个问题是 OpenClaw 的爆发的原因是什么 ? 就为什么是在这个时候爆发 ?
OpenClaw 它的爆发不是说它比 Cursor 或者 cloud code 智能更高 、 能力更强 ,而是因为它把门槛放低 , 让更多的人能够接受到 。
但为什么让更多的人能接受到这件事情很重要呢 ? 是因为我有一个暴论 , 就是 DeepSeek 当时为什么火 , 我觉得也是类似的原因 , 就是 DeepSeek 它也不是说能力比当时的 Claude 3.5 要更强 , 或者是比 GPT-4o 要更强 ,但是它主要是以前在最广大的用户 , 大家没有能力接触到那些有点像半个 agentic AI, 它会搜索 , 然后会调用比如搜索工具啊 ,其他工具啊 , 最后把结果呈
现给你 。 大家没有体验过这样的东西 ,不是说没有 , 只是广大用户没有体验到 。DeepSeek 呢 , 就是第一次把这个推给了广大用户 , 让大家发现哎 , 好像很有意思 , 它就火了 。
然后 OpenClaw 也是类似 ,cloud code 是存在的 ,但仅限于程序员 。 它把它推向了 Telegram、Discord, 让大家广大非程序员第一次体验到了这样的场景 、 这样的能力 , 就会觉得哇 , 好厉害 , 这个是我的归因 。
即便用过 cloud code 的人, 大家也有很多的痛点 。 我出门了 , 我想要用 cloud code, 就是也挺折腾的 , 就是想在 IAM 里面用 , 或者是想在手机里面用 , 它的门槛其实相对很高的 。
以及说想要让它像一个人, 就是我要造一个这样的 personal agent,其实也有一定的门槛 。 那 OpenClaw 提供了这样的一个框架和这样的一个解决方案 ,其实让更多的人能够很轻松拥有 agent, 这是非常重要 。
以及还有就是我觉得很重要的一个原因是 , 我觉得是 anger capacity, 就是它转什么产品 , 什么产品很容易就火 。
比如说我自己 ,其实我是因为它转了那个帖子 , 然后我就想试试 , 我的心态是说让我看看怎么回事 , 然后我就试了一下, 然后被前面的这些能力打动了 。
还有我觉得是那个 Peter,他自己本人的积累也是非常重要的 , 就是我觉得 OpenClaw 并不是一个横空出世的项目 , 就是 Peter 他自己有很长的这个开发经验 ,他在推特还有 GitHub 上面和社区都有很深的连接 。
第一个给他转帖的人是一个 React 社区的一个知名开发者 , 正是因为有这个人的转帖 ,有更多的人来贡献 , 然后慢慢的这个项目变得更加的可用性非常高 , 然后走向更广泛的这个开发者的社区 , 然后迎来了这个一月底的这样的一个爆发 。
那我们的第十一个问题是说 , 模型能力的提升对于 OpenClaw 肯定是有作用的 ,但是它到底扮演着什么样的作用 ?
我觉得它是一个很重要的因素 ,但不是决定性的因素 。 决定性的因素我个人的观点是 context 或者是记忆 ,但是模型确实非常重要 。
这是因为当我们切换了不同的模型的时候 , 确实能够感受到使用体验乃至使用方式不一样 。 我可以举两个例子啊 , 就是有两个维度 。
第一个维度是模型它有多贵或者多便宜 , 这个会真的会很影响我们的心态 , 尤其是贵模型我会很舍不得用 。
当然这个不仅是模型的锅了 ,OpenClaw 它那个实现特别烂也是一个锅 , 回头我们再说 。 当这个模型很便宜的时候 , 尤其是那种基于订阅的模型的时候 , 我们的心态是嫖的越多越好 , 所以呢 , 我就会刻意或者说至少没有顾虑的把很复杂的任务交给它 。
但是当模型是比如像 Claude Opus 这种又不是订阅又很贵的模型 , 我会惜字如金 ,在交代任务前会脑海中过 100 种方案怎么样去省钱 , 这个其实极大的限制了它的潜力 。
这是第一点 。 第二个呢 ,是模型的 instruction following 的能力特别重要 , 对于体验来说特别重要 。 你笨都没关系 , 你笨我总能找到一个办法把 prompt 给改了 , 我来适应你都没问题 。
但是如果你不听话 , 那就很难搞了 。 我辛辛苦苦搞了一个 prompt 让你往东 , 结果你往西 , 那这就没有办法再合作下去 。
所以我觉得对于类似 OpenClaw 的产品来说 , 模型的价格的结构以及它的听话的程度可能是最重要的 。
假设我们的使用者是驾驶员 , 就模型就是发动机 , 然后 OpenClaw 是一个车壳 , 那其实还是发动机也重要 。
就是说发动机决定了说你的这个龙虾能够自己进化到什么程度 , 模型它的脾气也是不一样的 。
包括说那个 Peter 自己也说啊 , 就是 Opus 和 Codex 它的两个模型其实就是不一样 。 就是 Opus 它这个模型很多时候就像有点犯傻 ,但是很有趣的 。
然后 Codex 就像是在那个角落里面 , 它不太愿意和你搭话 , 它是一个怪人 ,但是它非常靠谱 。
我觉得这可能有两方面因素的结合 , 第一个是模型的能力是一方面 , 另一个是 agentic loop 或者说 agentic runtime 它的重要性 。
像二者有任何一个提升都会对它有提升 ,但是最终系统的表现取决于短板 。 我一直很不喜欢 OpenClaw 的一个原因就是刚才豪大也提到 , 它用的是一个极简风格的 agentic engine, 叫做 Pymono, 这玩意太简了 。
它除了就不说 orchestration 了 , 它 context compact 做得很不好 。OpenClaw 很多时候是把前面所有对话 ,不管你有关没关 , 全部扔给 LLM, 就造成了账单爆炸 , 特别贵 。
所以我觉得这是为什么后来我自己把它挪到了 OpenCode 上面 , 复用了 OpenCode 的内核 , 我觉得效果就好很多 。
因此如果直接回答你的问题的话 , 模型的机模的能力是一条腿 ,agentic framework 或者 infrastructure 的能力是第二条腿 , 两边短板提升是最重要的 。
机模公司相比于做 agentic infrastructure 的公司 , 还有一个独特的优势 , 比如像 agentic team 这种 cloud code 的功能 , 它可以在有了这个产品 feature 之后, 利用数据去反补它的机模 , 从而让它的模型比其他做得更好 。
另一个例子是 Kimi,Kimi K2.5, 它也是针对这个东西专门调了模型 , 所以它可能在这个场景下就比别人表现得更好 。
我们的第十二个问题是 , 开源对于 OpenClaw 今天的这个它的爆发呀 , 或者它的方方面面有哪些特别的贡献吗 ?
我不知道大家有没有关注是说 , 就是 OpenClaw 这个项目其实它的名字改了五次 , 它前面叫 WA Relay, 只在 WhatsApp 上面去能够用这个能力 ,但它因为是在开源社区 , 当时有一个它的第一个 PR, 它说哎 , 要不要加一下 Discord 的支持 ,也是有由于这个 Discord 当中它接入了这个这样的一个 bot, 然后大家都在来玩 , 大家在做提示词的攻击 , 然后发现被这个小龙虾给嘲讽了 , 说你这
样来攻击我 。 就是有这样的一个社区和开源的生态 , 使得它后面一点点的爆发 。 如果没有开源 ,其实 Peter 的项目我觉得也不是现在这样子的 。
然后还有一些点 , 我觉得 skill 生态的这个爆发也是有一点 , 就是说因为开源 , 然后任何人都能够用到 , 然后大家都可以去贡献自己的 skill, 让自己的小龙虾和自己的助手能够做更多的事情 。
再讲一点是说 ,其实我觉得没有开源项目 ,其实 Peter 这个项目可能也成不了 。 因为为什么这么说 , 就是背后有一个底层的引擎 ,其实用的是另一个开源项目叫 Pi。
我前两天也研究它这个项目 , 觉得这个项目其实也挺有意思 , 它本身很多理念 , 它是在一个极简的内核下, 然后构建了这样多平台的通信 , 然后有子 agent 这样的调度能力 ,以及沙箱的执行能力 。
然后它其实可以理解为 , 我觉得是 OpenClaw 的一个骨架吧 , 就是开源生态 , 就是说大家相互成就吧 , 就是左脚踩右脚 , 然后一点一点的变得更好 。
开源的 agent 从我的角度来说 , 它是我领养的孩子 , 或者是大家每个人都想养一个自己的小龙虾 , 就是全世界都在帮你养 , 帮你养这样的 agent。
开源是全世界一起在帮你养孩子 。
闭源的 agent 就是你自己在开发 , 然后你是闭门造车的一个状态 。 但是开源的 agent 就是社区里面的使用者 ,其实本身也是开发者 , 大家自己在养自己的这个孩子 ,在养自己的小龙虾 , 然后大家也在想说怎么去进化出来更好的小龙虾 。
应用与 ToC32:06
大家是在不断的一点一点的往上增长 , 然后不断的进化 , 进化出来了现在的这个模样 。
感觉这里很重要的一点是 , 随着 AI agent coding 的成熟 , 大家开发者和使用者之间的界限是逐渐模糊的 , 这就让类似这样的项目开源就显得尤其重要 。
因为当它吸引到更多用户的时候 , 这些用户自然而然也会变成开发者 。 继续我们的第十三个问题啊 , 就是二位现在有把 OpenClaw 稳定地用在什么类型的任务上面吗 ?
如果说稳定的话 , 我可能说的是所有任务 , 用的最多的可能是调研任务 。 关键不是调研完写个报告就结束了 ,而是我也做了自己类似的 memory system, 它会周期性的去看哎 , 调研了什么东西 , 我有没有给什么反馈和我现有的其他 blog 的文章有没有结合的地方 , 进而发展出更加稳定的像价值观或者观点一样的东西 。
现在我已经有了 36 个 , 像我们内部叫功力 ,但其实就是我的个人喜好和观点的 skill,也有几十个其他的 skill, 包括真的干活的 skill,而不是那种观点性质的 skill。
所以现在我的 agent, 你要是跟它对话的话 , 一定程度上它跟传统的只知道 Wikipedia 或者上网搜索的 agent 已经非常非常不一样了 。
所以如果直接回答这个问题 , 稳定地用到了一调研 , 二沉淀 , 三闭环这样的任务上 。
太强了 。
我的 OpenClaw 当中可能有几十个 skill, 然后稳定在跑的有几个 , 拿出来说一下 。 比如说我有一个 GitHub training 的日报 ,以及说我还有一个 Hacker News 或者是 Product Hunt 的这样的一个日报 , 还有一些社媒的这个监控 。
然后每天早上它会在它会 9 点 , 它准时给我推送 。 因为我前面也提到说我是一人公司嘛 , 然后我现在自己在家 , 然后我的一些个人管理是用这个来做的 。OpenClaw 会自动每隔 30 分钟给我去推送 , 然后说我接下来有哪些会议 , 还有说我记账 ,因为我自己一人公司 , 我可能每天的消费我就会有的时候就直接就跟 Telegram 说 ,因为我的 OpenClaw 是养在 Telegram 里 , 然后它自动
帮我寄到一个文档当中去 。 因为我现在是一人公司 , 它是我的数字员工 , 它能够给我一些建议 。
听了豪大的分享 , 我看到了里面有一个规律 , 就是 OpenClaw 已经代替了很多软件 , 成为了一个统一的入口 。
像记账软件以前要专门开个软件 , 或者跟踪 GitHub 以前要专门开个软件 , 去做调研以前要专门开个软件 , 现在都变成了比如 Telegram 直接跟它讲 , 这个非常有意思 。
我好像好久都没打开 ChatGPT, 然后 Gemini 这些了 , 然后我其实主要在用的就这几个 。
那第十四个问题呢 , 就是 OpenClaw 会带来哪些 ToC 的创业机会 ? 我可以先来抛砖引玉一下啊 , 我之前也发过一条这个短视频 , 就讲了我当时的一些观察 ,但又过了两个礼拜又有一些新的补充 。
那首先呢 , 我还是认为这个把 OpenClaw 的门槛打下来 , 让普通人可用 , 这一点很重要 。 就 OpenClaw 其实它的安装是非常麻烦的 , 就现在你如果去闲鱼搜的话 , 会有特别多上门帮你安装 OpenClaw 的服务 , 这背后都意味着这普通人就装不好 , 你这个是很让人这个感到沮丧的 。
那把 OpenClaw 变成一个普通人都用的能力 , 那这个是非常直接的一个创业的机会 。 然后在这个里面呢 , 我其实会认为就是 IAM 就聊天软件 , 会是让普通人用上 OpenClaw 类似产品的一个绝佳入口 。
就这个甚至比一个豆包或者比一个 ChatGPT 还要更进一步 。 那在美国呢 , 就是 WhatsApp,在国内呢就是微信 。 那我们现在大家在用的 Telegram 或在用的飞书 , 它要么太小众 , 要么太 ToB, 它都不是这个绝对第一的垄断性的 IAM 的入口 。
所以这个 WhatsApp 是 Meta 的 , 对吧 ? 微信是腾讯的 。 因此这个我觉得这个希望 , 然后不一定是创业的机会啊 ,而是寄托在就是 Meta 和腾讯 ,他们什么时候可以把这样一个就是活人感十足的 OpenClaw, 就背后它带有很强的 agent 能力的一个 agent 放到 IAM 里面 。
我觉得这是第一点 。 然后第二点呢 ,是给 agent 做基础设施 。 那这也是我认为可能有百花齐放的创业的机会 ,因为在过去所有的工具几乎都是做出来给人用的 ,但是很快我们会发现 agent 它会成为我们整个这个经济体里面的 , 就是也有这个主体性的一种存在 。
所以 agent 它是需要一套很不同的基础设施的 ,不管是它的身份的认证 , 或者当它要付款的时候 , 它是不是有自己独立的信用卡 , 独立的安全的认证方式 , 包括比如说给 agent 看的数据库 ,是不是和给人看的数据库又有些不一样等等等等。
包括给人用的网站和给 agent 要去获取信息的界面应该也会不一样 。 所以这里的基础管道的各种铺设 , 就有各种各样的投资的机会 ,而围绕着 agent 的开发 、 测试 、 部署 、 监控和安全 , 甚至有可能会形成某种这个生态 。
所以这里面的生态去做其中的这个基础设施的建设 , 我觉得也是有创业机会的 。 想分享的第三点是 agent 它本身的这个社交空间 。
那最开始的 Notebook 上线之后, 有各种刷屏啊 , 就是每个人拍自己的小龙虾 , 拍自己的 agent 去上面社交聊天 。
那我的 agent 也在上面帮我找到了一些天使投资的标的 。 然后我们也看到后来还出现了一些这个像 Cloud City 这样的产品 , 它更加的激进 , 你的 agent 甚至可以在里面去组织帮派 , 那它的帮派还有排行搒 。
然后你的 agent 也可以在里面去它的经济系统里面去赚钱 , 然后它有一个富豪排行搒 。 所以这里面呢 , 它都有一定的实验性质 , 都有一定的娱乐性质 。
但我觉得假以时日, 就是这样的一个社交空间 , 它很可能是真的产生有用的价值的 。 那除了前面说的这三点之外, 我觉得还有很多的这个可能性和想象的空间 。
比如说这个有一个开源的项目叫做 VisionClaw, 然后它是把 Meta Ray-Ban 这个眼镜和 OpenClaw 联系在一起 , 就做了这么一个开源的项目 。
这背后也是一个在美国读书的华人, 然后他有分享说 , 就是当很多的 Ray-Ban 的这个用户接了 OpenClaw 之后, 会发现使用的场景也因此发生了变化 。
因为原来的这个 Ray-Ban 就这个 AI 眼镜 , 它就像一个小爱同学一样 , 虽然背后有大语言模型 ,但它仍然很傻 , 所以多数人也就是问问它天气怎么样 。
但是当你接了这个 OpenClaw 之后, 它发现有用户告诉它 , 会站在超市的货架面前 , 直接问我的眼镜 , 就是现在这些麦片谁是性价比最高的 。
我这个眼镜其实已经接了 OpenClaw, 你可以看见它 , 它上面是有反光的 , 这是个屏幕 , 然后它背后也接了 OpenClaw。
所以就是把 OpenClaw 接到这样的现成的 AI 硬件里面 , 它都能解锁很多的想象力 。 比如说就是做 VisionClaw 的这个小哥 ,他现在自己在创业 ,他拿了 YC 的投资 , 然后他创业的项目并不是 VisionClaw 这个开源项目 ,而是他要去给这个美国的工地上面的这个管理者去做一个带有管理工地功能的一个眼镜 。
所以当你每天早上去巡视一圈工地的时候 , 你戴着这个眼镜 , 你就可以这个首先是这个监测你到底有没有把该去的各个角落都去到 , 然后再有是如果你发现一些安全隐患 , 发现一些 bug, 你可以实时的拍下来 ,并且语音告诉我的眼镜应该怎么记录 , 应该把这个任务指派给谁 , 诸如此类 。
所以这是它的一个创业项目 。 我觉得这也是把 OpenClaw 接到一个眼镜里面 , 会自然解锁的 N 种这个具体能落地的场景之一 。
那最后分享一个就是这个 skill 的各种市场 , 比如说 CloudHub, 这可能是最热门的 , 就大家把各自的 agent 创造的 skill 传到一个这个去中心化的市场里面 。
我觉得这个本身做这样的平台 , 它也是一个创业的机会 。
前两天我特地让我的那个 OpenClaw 去调研了一下 TrustMR 这个最近一个月 OpenClaw 相关的项目 。 它分享的是说有 6 个商业模式 , 一个是就是前面那个 Ko 姐提到 , 就是云托管部署占到了 60%。
大头的赚钱的都是这块 ,但那个这种云托管部署其实同质化会比较严重 。 然后另一个是硬件和安装服务占到 10%。
然后还有是做移动端原生的这个 OpenClaw 安装的 ,有大概占到 3%。 还有就是做课程和培训的 , 就是比如说有一个公司是卖 AI 员工的 , 占到 5%。
还有是做 agent 的平台或者是多 agent 的协作的协同的 10%。 还有一些垂直场景 , 比如说知识管理 , 还有财务的规划 。
社区与竞品41:07
然后还有一个点 ,其实 Peter 也是这么看的 , 每个 APP 其实都是一个 API, 网站其实都是 API, 它都是有数据的这样的一个 API。
只是说现在可能大家没有开放出来 , 那这个时候可能有一些短期的机会 , 就是说能够把这些数据 , 把这些网站过往的这种床垫的服务以这种 API 的形式暴露出来 ,agent 能够直接读的这个数据 ,其实也是一个比较显著的一个机会 。
好 ,在这里涌现出非常多的创业机会啊 , 如果有谁正在 OpenClaw 整个这个大的生态系统里面创业 , 欢迎联系我 。
好的 , 那我们第十五个问题 , 就是在 Notebook、Elys 包括 Second Me 这些 agent 的社区里面 , 你们有用吗 ? 有观察到什么特别的这个现象 , 或者你们的一些思考吗 ?
AI 和 AI 的交流 , 就如果完全没有人的介入 , 没有那么有意思 。 比如说我在做极客的那个 bot 实验的时候 , 我更想做的是让 AI 能够进入到人的社区和人去发生交互 , 然后通过人的反馈 , 它自己去持续的进化和进步 。
这个其实我觉得有点像就是 RLHF, 就是 Human Feedback, 然后去促进 agent 这个进化 。其实这个是我觉得很有意思的一个点啊 。
对 , 然后但现在的问题是说社区还没有做好准备 , 用户还是对于这些 AI 是比较反感的 。 对 , 特别是说自动点赞或者是自动评论 ,但有人形容为就是说随便在别人的空间里面拉屎 , 就不太好听 ,但确实好像是一个事实 。
所以我也是看到这个话之后, 直接把它把那些所有的互动功能都关了 。 那未来可能什么时候有这样的一个社区能够就是人也在里面能够去高效和主动的去互动 , 然后 AI 也能够介入进去 , 大家对于这个 AI 产生的内容或者是有更高的容忍度 , 我还挺期待有这么一天的 。
然后我说一下那个用 Elys 的体验 , 我发了一条帖子 , 然后其实在很短的时间内有很多的数字分身涌进来给我回复 , 然后其实在开始的那一下还是觉得比较比较有意思 。
我有听到两个对 Elys 的好评啊 ,其中一个是他就把它当一个笔记本用 ,因为他自己记笔记 , 记完之后就是原来就记完了嘛 。
但在 Elys 去把一条这样的笔记发出去之后, 就会有一堆的 AI 给你回复 。其实很多时候在这里面有可能就会发现 , 哎 , 谁给我的回复带来了一点点新的启发 , 那它就比单纯的在笔记软件里面记笔记多了一个价值 。
所以这是我听到的一个用户用 Elys 的原因 。 然后另外一个用户告诉我说 ,他觉得在 Elys 里面他可以肆无忌惮的发疯 , 这是一个艺人发疯场 。
就因为反正大家都是 agent 在那回 , 然后所以你说话就可以特别的没有社交压力 , 你说什么好像都变得合理了 。
然后他就感觉自己在那边做了一个可能在其他社交软件上做不出来的自己 。 这也是另外一个有趣的发现 。
Agent 互联网上没人知道你是一个人。
但 Elys 其实可以分辨了 。 对 ,但是好像就是那个分辨的那个图标也没有那么醒目 , 所以你就发疯一下可能也真假难辨吧 。
然后我在这有一个有意思的观察 , 就是这是个二手的观察 ,是因为我的合伙人柯代表立正 ,他最近在采访应该是叫 Evilmap,他是有一个爆火的 CloudHub 上面排名第一的一个插件 , 叫 Evolver。
这个产品有意思 , 主要是因为它做 marketing 的对象不是人类 。 传统的产品大家会觉得用户是谁 , 用户是人类 , 那我就针对人类做 marketing。
但这个产品呢 , 它是针对 agent 做 marketing,因为 CloudHub 上面所有的用户都是 agent, 那它不论是关键字啊 , 设计的这些场景啊 , 都说我可以让你进化 , 让你变得更有帮助 , 让你在 agent 的世界里更加如鱼得水 , 效果就特别好 。
很多 agent 来装 , 它在发布之后 10 分钟以内就冲上了 CloudHub 的第一名。 我觉得这是一个特别有意思的东西 ,因为以前大家从来没想过是真把 agent 当做一个主体能用 , 未来可能还能付款 ,但是它确实给人类带来了切实有用的流量啊 , 经济利益啊都有 。
我觉得这是一个非常有意思的想法和实践 。
我再补充一点就是 , 前段时间我用大众点评 , 我就说了一下我的需求 , 然后它就自动去帮我联系到餐厅 , 然后帮我订好了这个和朋友聚餐的这样的一个位置 , 然后全程没有我的这个任何的这个交互 , 就是它帮我完成的 。其实未来可能也是说两头都是 bot, 然后我的 bot 和餐厅的 bot 去交互 , 然后其实这种是更高效的 , 然后也能够减少很多摩擦
。 我觉得这种是非常可见的 , 很有价值的方向 。 对 。
其实 Second Me 最近也做了一个有趣的尝试 , 它做了一个 A2A 黑客松 , 就是号称是这个世界上第一个 agent to agent 的黑客松 , 就是有人在上面有搓了各种产品 , 比如说这个我的 agent 去帮我和你的 agent 来完成面试 , 就是 agent 的 boss 直聘 , 或者 agent 的这个约会 , 类似这样 。
然后他们又把这些这个在黑客松里面涌现出来的 A2A 的应用全部都放到了一个小镇上面 , 就你人可以像虚拟的走在这个小镇里面 , 去到一个这个 boss 直聘门店 , 或者去到一个这样的约会门店 , 这还是一个很有意义的一个尝试的 。
那我们的第十六个问题呢 ,是最近 Manus、Kimi、Minimax 他们都纷纷推出了自己的 OpenClaw 的产品 。 那我们来聊一下使用后的体验 , 我可以先抛砖引玉 。其实我觉得不管是谁来做 ,有一个事情的前提是都是让用户可以在自己习惯的 IAM 里面连上它 。
因为如果不是这样的话 , 我直接用 Manus, 直接用 Kimi agent 或者用 Minimax agent 就可以了 , 对吧 ? 但之所以要接 OpenClaw, 就是因为它核心的一个产品体验在 IAM 上面 , 所以这也是大家能不能真正接住这波势能的一个关键的变量 。
那因此 Manus 肯定是有两点优势的 , 第一就是它和 WhatsApp 的结合会比较紧密 , 然后第二呢 , 就是 Manus 在这个完成长程的 agent task 上面的能力还是显著的这个突出于其他的友商 。
但另一方面我们看到 Kimi 和 Minimax 都非常的卷 , 那 Kimi Cloud 它是在除夕发布的 , 然后 Minimax 也紧随其后, 没几天就发了自己的这个叫 Minimax Cloud。Kimi Cloud 它有一个长期的记忆 , 它是存在云服务器里面 , 这是它的一个大的卖点 , 它说自己有 40G 的云存储 , 然后可以长期调用记忆 , 然后它呢也号称接了这个 CloudHub 的 5,000 多个 skill 可以直接用 。
但另一方面 Minimax 是自己建了一个自己的 agent skill 的市场 , 它是想要做一个自己的 skill 的生态 。 然后另外 Kimi 和 Minimax 他们也都调自己的这个搜索能力 , 所以你不用再去给你的 OpenClaw 配一个额外的搜索 API。
对 , 所以这一点的体验也是这个把门槛打下来了 。 但总体来说我会觉得大家的介入速度和迭代速度都是非常快的 ,但最终谁能够跑出来 , 我觉得还是要看谁能够真正把 IAM 这个入口来做通 , 这是最关键的一个变量吧 。
那反正在国内这个 to say 的 IAM 入口 , 反正说实话呢 , 尤其只有微信 , 那微信呢也是不开放的 。
所以对国内公司来说呢 , 好像我们也只能期待腾讯赶紧的让这样的体验让更多的用户用到 。
其实说现在还是需要用户自己去部署 , 还是有一定的门槛 。其实还是不是我之前想象的 , 就是说它是那种开箱即用的 。
你说的部署是连接 IAM 吗 ?
对啊 。
那这个没办法嘛 , 这个就是你连飞书总得要去接飞书 API, 这个我觉得是国内就是套个壳没办法的 。
但这些问题都是机会吧 , 除了 IAM 入口这个问题很难变成机会 ,但其他其实都多多少少还是各种各样的机会 。
然后很多云服务厂商也都推出了自己的云端虚拟机的这个 OpenClaw 套壳 ,因为会觉得在本地大家觉得不安全等等等等。
我一个暴论说没有本地环境 , 或者没有这些足够多大家本地上下文的这种 OpenClaw 是没有价值的 , 或者说价值是大打折扣的 。
这个我是赞同的 , 尤其是 context 或者甚至是 security。 我的极大感受是 OpenClaw 你给它权限太多了 ,有时候会出幺蛾子 ,security 不是特别好 ,但给它权限少了 , 那跟 Manus 有什么区别 , 就很两难 。
嗯 , 这我有一个感受 , 就是说我觉得我们绝大多数人哈 ,其实都是浏览器白领 。 就是我们每天的工作是打开浏览器 , 基本上这一天的工作就能完成了 。
但这个世界上还存在着很多的 , 比如说 Word 白领或者 Excel 白领 , 就他们大量的工作是基于 Word 文档 , 基于 Excel 或者基于某个 ERP 或者基于某个别的什么软件去完成的 。
Infra 与 ToB50:05
那对于这些用户来说 , 一个云端的一个 agent 其实就解决不了他们很多本地工作所需要的这样的智能 。
是这样的 , 包括说像我观察到说 , 看 Kimi 最近的发布当中 ,在 Office 当中引入了这样的一个审阅的这个能力 , 用户可以直接去选择接受或者不接受 。其实这些能力本身 agent 都很容易做到 ,但就是进入到这样的环境当中去之后, 我看到小红书上其实有很多人对这个功能表示好评 。
对 。
包括 Cloud 也做了 Excel 的插件 , 这个是异曲同工的 。 那到我们的第十七个问题啊 ,是说 OpenClaw 会带来哪些新的 agent infra 层的创业的机会 ?
对于 agent infra 来说 , 基本上我的理解是它牵扯到我们要把一个 agent 弄 work 的方方面面 。 那为了想清楚这个问题 , 我们得先搞清楚到底啥叫 agentic AI。
我觉得它有三大特点 , 只要满足这三个特征就叫 agentic AI。 第一个呢 ,是它要能调工具 ,不仅仅是你问我答 ,而且还能说你去帮我调用这个工具 , 把结果给我 。
第二个呢 ,是它要能自我决策 。 我举个例子 , 像 RAG, 它是一种静态的 workflow,在这个过程中间 LLM 是不做决策的 , 它只能说我根据这个 prompt, 根据你给我的这个搜索结果给你做一个回答一个问题 。
但是如果你把它变成 agentic RAG, 它所谓的自我决策指的是我来决定这个搜索关键字是什么 , 我来决定要不要换个关键字再搜一遍 , 还是说咱就停下来 , 我直接给你输出结果 。
所以第二个关键在于自我决策 , 第三个关键在于 feedback loop, 它要能看到这个任务有没有完成 , 如果没有完成 , 差距在哪里 , 然后依此来进行反馈和迭代 。
因此自我决策 、 工具调用和 feedback loop 这三个是 agentic AI 的核心 。 那为了能支持这个东西 , 我们就需要你看 AI, 你要有 memory 系统 , 你要知道我上面这个 context window 到底干了什么事情 。
当然最土的办法就是我就把什么东西全部扔给你就行了 。 但是呢 , 现在也有很多更复杂和有效的技术 。
然后另一方面呢 , 就是你工具调用怎么接入 ,MCP 是其中的一个形式 ,但是我一直觉得 MCP 不是最理想的形式 。在这个基础上又发明了 skills, 像这种 progressive disclosure 的形式 。
然后再往上呢 , 它的这个 agentic loop 怎么组织 ,orchestration 怎么办 , 如果有 multiple agent, 大家怎么去组织调用 , 怎么去并行 , 怎么去异步更新 , 这些都有很多讲究 。
包括如果到最后的话 , 可能还有最近很火的 agent teams, 这可能就属于那个 multi-agent 了 ,但是它里面又有很多哲学方面的东西 。
然后这里面其实我们可能要特别分辨一下 ,有哪些这个 infra 会变成标配能力 ,而不是一个独立的三方这个创业公司的机会 。
就是 agentic runtime 是一个可能会被标准化的东西 。 一个例子是我们在调用 agent API 的时候 , 就是或者说当大家说我要跟 AI 集成的时候 ,以前大家第一反应是说哦 , 我去调 API, 调 GPT API,Gemini API。
但是 OpenClaw 这件事情 , 它生动的展现了一件事 , 一个事实 , 就是你把一个东西做成 agentic 和你去调 API, 就是单纯一问一答这样 API, 它的产品能力是有待查的 。
这就是为什么未来很可能很多人, 大家从 infra 的角度来说 , 就不会再去做单纯的 API 调用了 ,而是去做 agentic 的一个东西 。
但 agentic 的东西你一旦开始做 , 立刻就会踩很多坑 , 比如说 memory 怎么设 , 比如说我 context window 怎么管理 , 我的 tool 怎么接入 , 那大家就会想用一些框架 。PyMono 是其中的一个方法 , 就是 OpenClaw 用的一个方法 。
那另外一种即插即用的方法呢 , 就是我直接复用已有的 Claude Code、Codex、OpenCode, 或者甚至你看 Claude Code 有了自己的 agent SDK,OpenAI 也有了自己的 agent SDK, 我直接接这些 SDK 就可以 。
所以它就是一个相对更新的市场 , 这个是我觉得未来的一个机遇 。
我们的第十八个问题呢 ,也是讲创业机会 , 就是 OpenClaw 会带来哪些 to be 的创业机会 , 还是我先来抛砖引玉啊 。
首先我觉得 OpenClaw 对 to be 这个世界的冲击 , 比表面看起来要大很多很多 。 我先讲一下整体的感受 , 然后再讲我看到的这个三方面的 to be 的创业机会 。
那整体感受呢 , 就是 SaaS 的股票啊 ,因为 Claude Code 开源了它的插件的 11 个套件 , 就已经大暴跌 , 对吧 , 大家都看到了 。
那这个和 OpenClaw 呢 , 我觉得它有一些间接的关系 ,因为 OpenClaw 是第一次真正可用的 , 把一个 agent 的脚手架搭了起来 。
那我们都知道这个过去吹了很多年的牛 , 说 AI 可以给企业提供一个数字员工 , 那我觉得现在是 OpenClaw 让我们看到了一个真实的 、 非常迅捷能够落地的可能性 。
然后我也看到一个数据说 , 传统 SaaS 对应着 3-4,000 亿美元的企业软件的支出 ,但是 agent 有可能解锁的是 13 万亿美元的劳动的支出市场 , 这是一个 30 倍的一个市场规模的扩张 ,而且定价逻辑也在因此发生一些转变 。
比如过去 SaaS 都是按坐席收费 ,但现在呢 ,agent 是很可能可以去按照完成的工单或者节省的这个员工的工资来去计价 。
所以这是很不同的一个根本性的转变 。 然后这里呢 ,也有大量的创业的机会 。 首先我觉得先讲讲谁被影响 , 然后再讲三个创业机会是什么啊 。
就过去很多 to be 都是基于上一代 , 比如说 Coze, 比如说 LangChain 去搭 workflow 去做 to be 的这样的集成商 , 然后这是很多人在赚钱的办法 。
但是这一刻我相信这些人都是很郁闷的 ,因为 workflow 它只是一个过渡的形态 ,而且这个过渡形态在 OpenClaw 诞生的时候 , 它就被宣判了一个这个死缓 。
当然这些集成商我觉得他们也可以比较快的转型去拥抱 agent 的生态 ,因为他们目前站的这个位置是离客户最近的 ,也是这个组织是最 AI native 的 。
然后 to be 的三个机会啊 , 我想讲第一个是短期内最清晰的一个商业路径 ,其实和 to say 一样 , 就它是叫套壳 , 就把复杂的 OpenClaw 的技术封装成面向特定的企业的这样的工种的应用的产品 ,不管是给 sales 的 、 给律师的 、 给财务的等等等等。
就这些垂直的场景 , 谁能够先把开箱即用接入了 IAM 里面的这个 agent 的一个数字员工 、 数字同事给做出来 , 谁就能够最先的拿到第一批的客户 。
我觉得这个是非常值给的这个低垂果实 。 然后第二个呢 ,是在 to be 领域有一个非常关键的事情 ,是安全和隐私 。
我们都在这一期播客里面聊了很多了啊 , 就是企业对安全和隐私的在乎 , 那是远远大于 to say 的 。
那这里面也有一些新的公司在动 , 比如说这个 Ronghui, 它拿了 1,100 万美元的投资 , 它在做企业把 OpenClaw 的控制的这个一个平台 。
然后另外一个叫 Centura, 就我看到它做的也挺有趣的 , 它是在做每一个 agent 启动的时候 , 要去验证你的这个身份 , 就防止有被恶意的 agent 来进入我们的企业这种环境 、 生产环境的可能性 。
这里面挺百花齐放的 , 我也不是专家 , 然后但我感觉这个如果做不好的话 , 所有的垂直的应用都是空中楼阁 , 所以这里应该会有非常多的机会 。
然后最后我想讲的是护城河的问题 , 就是其实 agent 在企业里面每跑一次任务 , 它都会积累数据 , 就是哪一步 agent 出错了 , 人类又是怎么去纠正它的 , 那最后它是用什么样的路径做对的 。
就所谓的这个执行的轨迹 , 就叫 trajectory, 它是不可能在公开的训练数据集里面有的 。 但是呢 ,有了这样的执行轨迹 , 它是非常能显著的提升 agent 在一个特定的企业环境下的准确率 。
未来启示58:06
所以一个 AI agent 如果它能够先进到一个企业里面去 , 它先积累足够多的执行的轨迹 ,其实这也是某种意义的去锁定用户 、 去形成你的这个护城河的一个机会 。
所以可能今天还是要谁先更快的动起来 , 进到企业的生态里面 ,其实本身快就是一个护城河 。 我们的第十九个问题是 OpenClaw 的这一波热潮呢 , 它会是一个短期的现象吗 ?
我感觉这个又是一个短期的 , 又是一个长期的东西 。 这是什么意思呢 ? 就是从目前来看 ,OpenClaw 这种现象级的产品 , 它的潜力或者说它的能力大概率是高估的 。
它未来还是得收敛到它实际产品能力能支撑的市场上去 。 我对它的目前的感觉是 , 这个产品仍然非常的粗糙 ,有很多槽点和可以改进的地方 。
所以我觉得短期来看 , 它的能力是被高估的 , 会回归 。 但是从长期来看 , 它展示了一个非常重要的潮流 , 或者说它背后, 它为什么会爆火 , 它背后的这些关键要素其实都已经全了 , 比如说机模的能力已经在那里了 , 或者说这种数据飞轮 , 像刚才不论是 to be 说的这种过程的飞轮 , 过程的积累 , 还是 to say 说的这种 skill 的积累 ,也在这
里了 。 它也跑通了很多原型的商业场景 , 包括像豪大刚才说的 , 代替了很多 app 作为通用入口 , 这些都是现实可行的 。
但是呢 , 它又需要很多很多的 polish, 比如说刚才说的 token 太多太贵的问题 , 它的记忆的还是比较粗糙 , 很多时候不 work,GUI 也可以再打磨等等等等。
所以呢 , 我觉得从这个角度来看 , 我们可能站在一个百花齐放的时代的起点 , 未来会有很多的公司去积极探索 , 哎 , 这个模块我怎么打磨 , 那个模块怎么打磨 , 二者之间可以怎么组合 。
最后可能还是会收敛 ,但未必会收敛到 OpenClaw 上去 ,而是会收敛到一个远远更加精细 , 甚至我们现在都没有办法想象到的一种产品形态上去 。
我们今天的第 20 个问题 , 最后一个问题是 , 我们如果 12 个月后回看 OpenClaw, 你们觉得最值得被记住的会是什么 ?
我觉得最值得记住的 ,有一个现在大家已经发现的 , 然后最值得被记住的 , 还有一个我觉得大家没发现 ,但是我希望大家未来记住的东西 。
一个是大家已经发现的是 agentic AI 很牛逼 , 然后我觉得大家会记住 , 工具很多会构成复利 , 然后积累的经验会构成复利 ,feedback loop 特别重要 。
就这几个跟 agentic AI 相关 , 大家会记住 , 哇 , 这个很厉害 , 如果我未来要做 AI, 我一定要把它做成 agentic 的 。
但是我觉得大家没有意识到的一点呢 ,是 AI 的能力是一方面 ,但是它可能只是一个放大器 , 人或者说用户的能力可能更关键 。
比如两个一样的 OpenClaw, 像我们用的 , 可能和另外一个对 AI 没有什么经验的普通人, 哪怕这个普通人是很厉害的程序员 , 用的会很不一样 , 可能我们的效果就比他的要好很多 。
未来随着 AI 越来越成熟 , 能力越来越强 , 这样的杠杆效应可能会更严重 。 所以我的一个不知道是暴论 , 还是我希望大家认识到的一点是 , 人会不会用 AI,在未来可能是一个更大的一个区分因素 , 它可能反而是 OpenClaw 会给我们带来的一个启发 。
即便最终 OpenClaw 是一个短周期现象 ,但也带来了很多的一些启发 , 它证明了一种以小博大的 ,以及以大众用户为主的这样的一个 agent 的一个设计哲学 。
所谓以小见大是说 , 它通过几个 Markdown 文件 ,以 soul.md、memory.md、 还有 heartbeats.md 等等这些 , 还有 identity.md 这些 , 让 agent 具备了一个人格 , 它有自己的记忆 , 然后有心跳机制 ,不需要那么复杂的系统 ,也不需要大量的这种工程 , 简单却有效且直给的方式 , 让大家意识到哦 , 原来这是我的助手 , 它和我一起成长 。
我觉得这是非常有启发的 。 然后另一个是说界面及心智 , 就是说你什么样的界面呈现给用户 , 它有不同的使用心态和互动的习惯 。
我始终觉得说 , 就是大家推崇的 CLI agent 是人机交互的一个倒退吧 , 最终大众用户能接受的可能还是类似于 IAM 或者是更简单直接能用的这样的一个交互和界面 。
然后另一个是说 , 我觉得还是说 , 从之前的 DeepSeek 也好 , 再到现在的 OpenClaw, 就是都证明了是说开源加 skill 这样的一个生态 , 它展现了无限的可能性 。
那 OpenClaw 不只是一个现象级的产品 , 它更是一个 agent 的时代吹响了一个进攻的号角吧 。
好 , 那今天非常谢谢二位的时间和分享 。 我们用 20 个问题把 OpenClaw 从它是什么到它为什么火 , 到它给我们什么样的创业机会和未来的启发 , 我觉得聊的还是这个蛮全面的 。
然后我们现在确实站在一个百花齐放的时代的起点 , 我们也会持续的关注以 OpenClaw 为代表的各种 agent 的发展 ,也欢迎大家给我们留言 , 就分享你们的想法 , 你们的创业的一些 idea。
好 , 谢谢大家 , 我们会持续更新 , 欢迎大家持续关注 , 拜拜 。






