十字十字路口Crossing2025年10月21日· 1:31:24

2025 AI 现场:我们这一年的目击与狂想

庄明浩与Koji、Ronghui复盘2025年AI行业,聚焦DeepSeek R1、Agent元年、多模态模型、开源生态与资本泡沫。他们指出DeepSeek R1以百万美元成本撬动百亿美元基建叙事,拉开中美技术路线分野;Manus首次让用户认知Agent形态,定义心智价值;多模态战场因视频工具化场景明确竞争激烈,Sora 2使AI走进千家万户;开源成为中国对抗美国AI的唯一武器,但二级市场已逼近极限,Sam Altman押注未来五年预期,泡沫风险隐现。

  1. 0:00开场
  2. 2:05拐点
  3. 3:29大模型
  4. 23:42多模态
  5. 39:11Agent
  6. 49:12端侧智能
  7. 53:01开源生态
  8. 1:08:36资本视角
  9. 1:26:48算力与机器人

转录文稿

开场0:00

Koji 杨远骋0:05

欢迎收听 《 十字路口 》, 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会 。 十字路口是乔布斯对苹果公司的一个比喻 , 形容它站在科技与人文的十字路口 , 伟大的产品往往诞生在这里 。AI 正在给各行各业带来改变 , 我们寻找 、 访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者 , 和他们一起探索拥抱新变化 、 新的可能性 。

我是 《 十字路口 》 的 Koji, 联合创办了街旁 、 新世相和躺岛 , 发起了 AI Hacker House 这个新一代 AI 创业者的社群空间 。

我相信科技 , 尤其是 AI,是我们这一代人最大的价值创造机遇 。 欢迎大家找我聊天 , 碰撞想法 , 链接下一个可能性 。

Ronghui0:55

我是 《 十字路口 》 的 Ronghui,在美元 VC 工作过 ,也做过 5 年的硅谷驻站记者 , 关注科技发展和商业故事 ,也欢迎大家找我聊天和我交流 。

Koji 杨远骋1:07

本周的 《 十字路口 》 呢 , 我们的嘉宾是老朋友庄明浩 。 那今天呢 , 我们会和明浩一起来复盘 2025 这一年下来的科技大事件 ,以及 AI 的一些时代回忆 。

那也很重要的就是 , 我们三个人身在这其中的一些感受 。 说实话 ,在准备这一期播客的时候 , 我的感受其实就是一个字 , 就是感觉非常的快 。

因为不管是技术的迭代 、 是产品的更新 、 还是全球格局的各种变化 , 都感觉 2025 年很像是按下了一个 8 倍速一样 。

身在其中经常有 , 就可能去年大家老说的一句话 , 叫做 "AI 一年人间十年 "。 就这个 , 这句话好像最近大家不怎么讲了 ,但是这个感受仍然是存在的 。

然后明浩呢 , 是一直在记录这个时代 , 一直在做 PPT, 然后我自己给他起了一个外号 , 叫做这个 AI 时代的司马迁 。

那我们今天的第一个问题 , 就是想问一问 AI 时代的司马迁吧 , 就是明浩 , 你觉得未来的人们会怎么来聊起这一年 ?

拐点2:05

Koji 杨远骋2:05

这会是一个泡沫之年, 还是这会是一个转折之年, 还是会是什么别的关键词 ?

庄明浩2:11

我想到一个词 , 可以非常好的贴到今年的发展状态里面 。 我觉得这个词叫 " 拐点 "。 然后拐点的好处是说 , 它是可以向上拐 ,也是可以向下拐的 。

也就是说 , 未来无论怎么样 , 它可能都是对的 。 如果比如说向上拐呢 , 很简单 , 我们看最近一段时间大家讨论比较多的关于这个数据中心的建设的问题 , 如果按照预期来看 ,26 年就是要爆的那个 , 所以它是向上拐的拐点的可能性 。

当然有另外一种探讨是说 ,是不是泡沫会不会破裂 。 那如果真的要进入到破裂的状态的话 , 那可能 25 年底就要往下走了 。

到了可能 25 年年底的时候 , 你会发现 , 我们不知不觉的走到了很多事情的极限里面 , 技术也好 , 产品也好 , 钱也好 , 资本也好 , 甚至到更大的话题里面 ,其实我们把 AI 这个事情已经走到了一个人类的极限的里面 。

Koji 杨远骋3:01

我们今天会分几个部分来做这个 2025 的复盘 ,因为 2025 发生的事情实在是太多了 , 我们今天肯定也没办法一一复盘到 。

所以这里面肯定有比较多我们自己的个人的感受 ,因为可能有一些事件对我们个人的冲击比较大 。 但是也有可能就有些人觉得 , 哇 , 这么大一个事情 , 这个影响了我的人生 , 你们竟然没有说到 。

对 , 这个很有可能会发生这样的情况 ,在所难免 。 那我们今天首先呢 , 会来聊大模型 、 多模态 ,以及聊 Agent。

我们再回忆啊 , 今年其实开年的时候有一个特别大的事件 , 就 DeepSeek 发了 R1, 然后那个当时是山呼海啸般的一个这个全球的刷屏 。

大模型3:29

Koji 杨远骋3:39

然后到今天 , 我仍然感觉它对我们整个就是生活 、 事业 、 方方面面产生了很大的影响 。 所以到现在再回头看 , 拉长了一点距离之后, 明浩你会怎么看 R1,以及它的意义在哪里 ?

庄明浩3:54

R1 的正式的这个发布时间 , 我们预测 1 月二十几号吧 , 就我们春节假期的前两天 。 然后当时这个 , 去年可能中国最有名的一个人叫冯骥 , 就是黑神话悟空的创始人 ,他发了条微博说这可能是国运级别的代表 , 然后引发了这一轮所有探讨 。

那两天反正基本上所有主流的美国的财经科技媒体全部都在报道 DeepSeek,因为与之相对比的其实是 ,其实在那个时间点 , 美国已经开始在建立关于这一轮 AI 的基于大的基础设施投资的这样一个叙事 。

那可能在新闻上在那个时间点出现的就是十亿美金 、 百亿美金这个体量 。DeepSeek R1 论文里只是说它最后一次的训练成本是一个大概一百多万美金的这个体量 。

那这两个数字之间的这个强烈对比其实引发了非常多的探讨 。 然后也 , 那从投资角度也 , 我们就比如说我们在这个时间点回头来看 , 美国的所谓的企业美或者 Nvidia 的股价 ,其实在那个时间点有一个巨大的跌幅 。

因为大家去探讨 , 你原来建立这套叙事似乎好像有别的方式去解决 , 它变了 , 它不是原来那个叙事 。

当然在那个叙事出现之后, 马上出现新的叙事 , 大家会说就跟当年煤炭的事业一样 , 就是煤炭的更多的发掘其实带来了更多的机会 。

它虽然会有一个短期的震荡向下 ,但是它会拉来更长的远期的增长 。 所以当时那个叙事是这样的 。

可是那个叙事回头来看 , 确实直到今天依然还在延续 。 就是关于 , 我觉得甚至可能从 DeepSeek R1 开始拉起了我们今天也会聊到的中美在大模型领域的竞争 , 它可能包括技术路线的竞争 , 包括开源闭源的竞争 , 包括产品落地是大是不是小 ,是参数是 MoE,是很多这样的问题的探讨的对立 。

而且还有点更现实的问题在于 , 如果我们回头来看 24 年中的时候 ,Sam 包括 OpenAI 提出了这个 R1 到 R5 的这个实时路径 。

那 R1 是可能大家都熟悉的 Chatbot, 到 R2 叫推理 。 那 R2、O1 是 24 年 9 月份出现的 。 那个时间点其实所有头部的模型厂商做的事情就是复现 R1。

当然 Claude 已经在之前已经做到了 ,但是其他的厂商其实都在复现 O1。 那 O1 其实是推理模型的代表 。 然后至 R1 之后大概两三个月时间 ,其实 Q1 的时候基本上头部厂商所有头部厂商的推理模型全部都推出了 , 直到今天依然大家在更新 base model 推理模型的进展 。

所以这条路径其实也是在那个时间点画的比较清楚 。 如果我们在 25 年底回头来看的话 ,在 25 年的纯语言模型本身的竞争的一个角度来讲 ,其实 R1 把这一年的竞争的路径跟要打的仗已经基本描述清楚了 。

后面的事情变成了工程 、 优化跟改进的事情 。

Ronghui6:32

除了 R1, 还有哪些模型的更新 ?

庄明浩6:35

Sora 2 那一轮破圈的 , 当然就是那个 GPT 风格的那个图片的那个事情 。 当然它又引发了版权啊 , 那乱七八糟的事情 , 就跟今天 Sora 2 引发的问题是一模一样 。

然后我们只看 OpenAI 的技术路线的话 ,在 24 年的时候 ,其实 OpenAI 已经给了世人一个对于 GPT-5 的巨大的期待的预期 。

因为大家会认为那是一个巨大的里程碑 , 那是一个可能翻越了所谓的 AGI 的临界点的一个什么东西 。 但是我们今年其实真正等到了 GPT-5, 可是 GPT-5 并没有显现出原来那种期待 。

然后我前两天看 Sam 去那个 H2Z 的那个播客 ,他提到这样一段 ,他说我们可能在经历的很多事情不会出现那种巨大的变化 。

就是如果我们回头来看 , 哪怕是 GPT-3.5 出现了 ChatGPT,其实某种来说也跨越了那个图灵测试的那个临界点 。

那大家原来会认为图灵 , 如果一旦机器跨越了图灵测试 , 会出现非常翻天覆地的变化 。 可是现实情况来看 , 已经过去两年多 , 我们好像就是轻轻的迈过去 , 然后就继续往前走了 。

我们可能也很难期待那个真正意义上所谓的 AGI 到底应该是一个什么样的东西 。 所以那在这个角度来看 , 那过去这从 22 年 11 月 ChatGPT 发布到今天两年半 , 快三年的时间 , 那其实悲观点讲 , 它还是在一个线性或者说接近线性状态里在走 。

至少在我们只把话题限定在纯的语言模型这个角度来说 , 确实是这样 。OpenAI 的可能先是 Sora 2, 然后 5 到后系列 , 然后呢 ,其他技术厂商可能 Google 今年的模型进展是非常快的 ,Gemini 也好 ,VeO3 也好 , 视觉模型也好 , 你会发现在纯技术角度来讲 ,Google 这一年非常强势 , 非常强势 。

Koji 杨远骋8:17

我们最近还写了一篇公众号文章 , 就在讲说这个 。

庄明浩8:20

为什么会 。

Koji 杨远骋8:21

Google 为什么回来了 。

庄明浩8:22

对 , 然后就是 Google, 然后 Claude 一直在 ,Anthropic 的 Claude 一直在做自己的事情 , 然后甚至更坚定的在 25 年做自己的事情 。

因为对于一个我们纯从市场经济角度来讲 , 它是创业公司的第二名。 那第二名是一定要跟第一名之间有差别的 。

虽然可能在纯底层技术模型的演进上差别那么比较小 ,但是在一些场景的选择上,Claude 已经越来越清楚了 。

Koji 杨远骋8:46

是的 。

庄明浩8:46

To be coding, 然后就打这几个最大的 , 至少这个阶段最大的场景 , 然后而且追的很紧 , 收入的增长的曲线甚至比 OpenAI 还要快 。

当然它体量小 , 然后可能这一年, 比如 xAI 的 Grok 的系列的更新 ,其实也蛮有一些特性 ,也有一些特性 , 比如它跟那个推特的合作 , 对吧 , 然后包括做那个虚拟陪伴的那个应用 。

Koji 杨远骋9:10

对 , 包括现在 Sora 2 出来之后 ,他们也非常快发自己的视频模型 ,而且路子很野 。

庄明浩9:15

对 , 非常野 。 因为它 。

Koji 杨远骋9:16

谁的照片都可以去生成 , 完全不尊重个人隐私 。

庄明浩9:19

它甚至可以 。

Koji 杨远骋9:19

它甚至可以在那个提示词里写 "spicy", 就是要辣一点 。 对 , 就是这是 Grok。 然后我觉得还有一点很现实的问题在于 , 这个可能就跟我觉得它除了是技术本身的问题 ,也是商业的问题 。

微软今年推出了自己的模型 ,在大概我们预测应该是 8 月底吧 , 那微软跟 OpenAI 之间的各种乱七八糟的问题引发了 , 你会发现微软不得不自己也要做自己的模型 。

然后这可能是美国这几家核心的厂商 , 对吧 , 我们提到了 OpenAI、Google、Anthropic, 然后 xAI, 然后可能 Meta 今年已经没有太多的声音 ,Meta 有别的事情在发生 。

Meta 的声音全是这个 。

庄明浩10:00

对 , 开出大支票在招人。 对对对 , 然后这是美国这家公司 , 那中国这家公司可能就是原来六小龙叙事已经结束了 ,其实已经没有人再去提了 。

但是今天这个时间点 , 可能中国的大模型厂商在技术角度来讲 , 一个最大的共识是开源 。 这可能这个关键词会在今天被无数次的提及 。

因为开源的生态的建立 , 包括可能我们在寻找跟美国这套 AI 叙事不太一样的路径上来讲 , 开源可能是手段 , 甚至可能是唯一的手段 ,有可能 。

我不知道 。

Koji 杨远骋10:32

待会会展开聊开源这个 。

庄明浩10:34

然后那你看中国的厂商 , 那开源最头部两家就是 DeepSeek 跟千问 , 就这两家基本上就是并驾齐驱的疯狂在涨的 。

然后今年, 我觉得今年纯从行业的这个发展角度来讲 , 我觉得 DeepSeek 的 V3.2 是一个很重要的这个标志 。 它标志什么呢 ?

它标志我们今年可能等不到 4。 因为就是你要知道 DeepSeek 的 V3 是去年年底就发布了 , 然后出现了 R1, 就 V3 是基础模型嘛 , 然后在基础模型加上经过强大学习和训练得到了 R1。

然后 V3.1 的不断更新 , 大家在前一段时间得到了 V3.1 的最终版 , 大家认为那下一个应该是 4 了 , 对吧 , 结果出了个 3.2。

然后大家还说 , 我们今年可能会不太能等到 4 了 。 那不太能等到 4 的情况下, 似乎我们今年可能不太容易等到 R2。

然后那千问我觉得就一直以来 , 我觉得千问的故事是绑在整个阿里在这一年的巨大的 AI 的叙事之上的一个东西 。

它包括开发者投入 , 包括千问全方位的对语言模型 、 多模态 、 编程各领域全面的覆盖 。 然后这是两家最前面的开源的厂商 。

然后我觉得 Kimi 跟智谱调整了一些策略 , 然后也在这一年里面发了他们的 , 比如 Kimi 的 K2, 然后智谱最近的 GML 的 4.5、4.6。

然后他们在 coding 也好 ,在 agent 也好的尝试 , 包括在开源领域的尝试 ,其实还在主线上 。 然后可能还有的就是 , 比如说可能一些我们叫自己的厂商 ,也还在尝试各种各样的路径 。

这是中国这边 。 然后欧洲那边有一家公司叫 Meitu, 就是我觉得在纯自然语言模型的技术的主桌上, 大概就是这些人。

然后今年就发了这些东西 。 当然只是语言 , 我们还没有太多谈到多模态 、coding 跟 agent。

Ronghui12:15

那你回头看 , 你觉得比如说十年之后, 今年有什么东西会被记住 ?

庄明浩12:21

我觉得 R1 肯定会被记住 , 就推理模型肯定 , 然后 agent 的代表肯定会被记住 。 多模态会被记住什么 ?

我觉得如果只选一个的话 , 我觉得会被记住 Veo 3 的发布 , 就是 Veo 3 就是 Google 的那个视频模型嘛 , 第一次大家从无声视频走到了有声 , 就是这是一个巨大的跨越 。

然后如果还硬要记的话 , 我觉得很有可能啊 , 当然也有可能会明年才记 。 就是世界模型 , 就是今年的世界模型的发展其实也是比较稍微有些加速的 ,并且参与的厂商越来越多 。

那这个阶段 , 世界模型这个板块还处于偏 demo 的阶段 , 还没有到更被值得探讨 。 但是如果硬要算 , 没准可能 25 年底或者 26 年初会是一个什么样的节点 ,有可能 。

Koji 杨远骋13:03

对 ,其实就像 Sam 提到的 , 就最近的这个发布已经是渐进式的改动 。 所以其实很多发布已经 , 尤其是大语言模型的发布 , 让大家没有那么兴奋了 。

所以在这样一个背景之下, 如果我们现在再看到一个模型说它又世界第一了 , 然后明浩 , 如果你看到这样的新闻 , 你会怎么去消化它 ?

庄明浩13:22

就像你刚才说 , 首先我去看它拿到了哪的学历 。 你现在有几个榜单是不同样的评判方式 ,有是按盲测的 ,有是按打分的 ,有是按它有题库 、 有一些原来的 benchmark 的底 , 然后来去做的测试 。

所以在不同的地方有不同的反馈 。 所以今天这件事情确实我觉得对于民众也好 , 哪怕对于行业从业者而言 , 拿到一个所谓的第一或者是凑塔 , 确实它的刺激性跟那个边际的那个状态已经非常非常小了 。

而且其实我甚至会觉得这些东西更多是向上管理 。其实今年我们刚才没有聊到 , 今年语音模型竞争也非常的激烈 。

因为我们做语音 , 我们有这个业务 , 我们知道这个竞争激烈到什么程度 。 就原来语音是一个偏边缘的战场 ,但边缘的好处是说它的投入量极小 。

所以对于比如说我们想 , 我们刚才还是那个观点 , 这场仗已经打了两三年的时间 ,有比如 25 年才进入战场的决策方 ,他想在一个地方建立一点点的声望跟影响力 , 跟哪怕为了 PR 写个稿 ,他也要选一个性价比高的地方 , 对吧 。

所以在语音这个板块竞争为什么会这么激烈 ? 某种就除了语音本身的场景落地越来越多之外, 另外一个我觉得就性价比的考量 。

所以你会发现今年我们回头去翻 PR 的文章 ,但是这些厂商来讲 , 第一 ,他们不是那个最大的大家伙 ,他们虽然当然也一定会把 AI 作为很重要的战略 。

比如他们内部有个类似 AI Lab 的这样的部门而言 ,他们这个部门老大成立了这个部门 , 然后已经晚了 。

虽然公司愿意投钱 ,但是你要在短期内证明自己部门存在的意义 , 你总要找到一个什么地方拉起这个旗 。

那语音看上去就是这个 。

Ronghui14:59

现在这个技术领先的窗口 , 这个越来越多 , 大家都说这个所有的 AI 厂商应该十一个假期都没过好 。

那在你来看 , 就是大家现在选一个 Chatbot 的这个付费的意愿到底是来自什么呢 ?

庄明浩15:11

那就变成了大家的使用习惯 , 你的付费的意愿 , 你甚至对品牌的认知理解 , 包括这一年大家去强调所谓的上海文字记忆的加长 , 对你的理解这些东西的积累 。

那这个东西是否能够形成所谓的飞轮跟正向作用 ? 那如果这个问题只有是跟不是的话 , 那我今天偏向于是 , 或者说开始产生作用 。

所以反过来讲 , 我们只看纯 Chatbot 这个战场 , 本身来讲其实纯 Chatbot 的战役已经打完了 , 就是 ChatGPT 已经赢了 。

即便可能过去两个季度 Google 的 Gemini 长得很好 ,但是它也是不过从可能零点几个百分点涨到几个百分点 , 就大概是这样 。

它确实翻了很多倍 ,但是它已经就是 other 里面了 , 对吧 。 因为大部分战场里的用户被 ChatGPT 拿走了 ,ChatGPT 已经公布了它最新的周活是 8 个亿 。

如果我们拉周活的每一次 Sam 去公布的那个数据 , 那个数据曲线是非常恐怖的 , 对吧 。 因为可能一年之前这个数字可能只有小几个亿 , 然后它在小几个亿周活的情况下 ,不到一年的时间内翻翻 , 甚至再翻一翻 。

今年年初的时候 ,有媒体的记者问 Sam, 就是你到底是要一个 AGI 的技术的最 top 的那个结果 , 还是要一个十亿用户的平台 ?

那 Sam 当然肯定说我都想要 ,但是它一定是偏后者 。 所以那个就是这又回到我们刚才讲的一句话 , 就是你会发现所有的事情在不知不觉间触碰到了一些东西的极限 。

用户量已经是了 , 对吧 。 你看到它已经是 8 亿的周活了 , 它还能怎么涨 ? 然后那其他那些电 、 钱 、 融资所有的事情其实都碰到了极限 。

所以这个角度来讲 , 我们只看纯 Chatbot 这个战场 ,ChatGPT 已经建立了绝对强的品牌认知 , 然后它又因为在加强这个记忆跟这个理解 。

我那天看了一篇文章 , 我觉得讲了很 ,他们在做的事情是当年 Meta 跟 Google 没有做到 ,但是微信做到的事情 , 就大一统的一个东西 。

所以在中国这套我们叫 all in one 的这个策略 , 你会发现这一次 OpenAI 的这个发布会 ,他在讲 Sam 在讲 ChatGPT 的时候 ,他会说直接在我对话框里会调用 Spotify, 调用那个 Zillow, 就是房产的 , 调用 Canva 做设计 , 调用 Figma 做 UI, 对吧 。

就是那不就是某种程度上的小程序吗 ? 对吧 , 我们只在产品阶段讨论这个事情 , 它确实在尝试 , 或者说它没有放弃掉成为那个 all in one 的可能性 。

Koji 杨远骋17:34

但我觉得这个背后还是这个 Sam 和 Anthropic 的 Dario,他们背景不同带来的一些 。

庄明浩17:39

对 ,是的是的 。

Koji 杨远骋17:40

就是最后从公司的战略选择或者核心竞争力上的不同 ,OpenAI 还是是一个非常有产品能力和战略能力的一家公司 。其实最近大家都在讲 Sora 2,其实我觉得好像已经忘掉了大概四周前刚发了 Pulse。

这 Pulse 也是一个我觉得遥遥领先所有人的一个东西 , 它其实就是在增强用户的粘性 , 让你把记忆用起来 , 甚至希望你形成这个从 WAU, 从周活用户变成日活用户的一个产品的举措 。

而从产品的实现上面来说 , 虽然是一个新产品 ,但是我自己认为实现的是很不错的 。

庄明浩18:16

很融洽 。

Koji 杨远骋18:16

很融洽 , 很自然 。 对 , 这个其实包括我们待会晚点会聊到 , 就是 OpenAI 现在像这个二级市场金手指 , 点哪哪的股价就涨 。

但我觉得这背后其实也透露出就为什么是你 , 为什么不是 Google, 为什么不是 Anthropic, 对吧 。 那这背后我觉得也仍然有 Sam Altman 他自己的这种战略能力或者舆论营造能力 ,并且他非常好的把这样的能力转化成了自己的优势 。

就是一荣俱荣 , 一损俱损 , 很可能最后泡沫会破灭 。 但今天我觉得如果泡沫真的破了 , 那很可能 OpenAI 也是剩下的那一个 ,他营造出了一种这样的一个竞争格局 , 这也是很了不起的一点 。

庄明浩18:56

世人似乎都忘了 Sam 原来是个投资人。 前两天也是他上那个 HOZ 的那个播客 ,他就说他说我不擅长做管理 , 我是做投资的 。

所以某种程度上说他在 OpenAI 内部的企业管理里面 , 某种程度上他也是在做类似投资的事情 。 我扶持孵化 , 支持一个 team, 然后有想法 , 然后帮他变得更大 , 然后不断的给他资源 ,其实确实跟早期投资很像 。

Koji 杨远骋19:19

最近有一个 OpenAI 内部的一个朋友 ,他也表达过类似的感受 , 就觉得 Sam 很像公司的投资人。

庄明浩19:25

对 ,因为你想 Sam 原来是 VC 的合伙人。

Ronghui19:28

对 。

庄明浩19:29

他都不单纯 , 对 ,他都不单纯是一家 VC 机构 , 就是我们原来这种美元 VC 的什么 Benchmark, 什么 Square、Sequoia、Light Speed,他不是那样的一个合伙人 ,他是一个 VC 的合伙人。

你要知道 Sam 在掌管 OpenAI 之前 ,他最有名的是他在 VC 上的创业课 , 那个是因为我大学是学那个技术经济管理 , 我们那个另外一个在美国的名称就叫创业管理 。

我是甚至给我的导师说 , 我说你去拿你的研究生进门第一课 , 直接去看 Sam 在 VC 上的那个视频就好 , 你不用看别的任何事情 。

就他原来是干这个的呀 ,而且他已经干到顶了 , 世人都忘了 。

Koji 杨远骋20:02

我们从 DeepSeek R1 聊起 , 然后现在再回头我们再看 R1, 当时还有一个评价是觉得这个中国人很会花小钱办大事 。

然后当时其实 R1 发布的时候 , 还有一个这个世人对 Sam Altman 的嘲笑 ,因为那会他刚签了一个 。

庄明浩20:19

大的合同 。

Koji 杨远骋20:19

什么星际之门计划 ,是叫这个名字吗 ?

庄明浩20:22

对对对 。

Koji 杨远骋20:22

一个金额巨大的一个合同 。

庄明浩20:23

5000 亿美金 。

Koji 杨远骋20:24

对 , 然后大家就说你看 DeepSeek 这就干出来了 , 对吧 。 你那个合同就这个美国就只会烧钱 , 所以这也是当时股价下跌的重要原因 。

但是回头看又过了几个月 , 可能过了大半年之后, 现在你觉得这个花小钱办大事还可能成立吗 ? 因为感觉美国仍然在氪金 ,而且疯狂氪金 , 氪的越来越多 。

庄明浩20:46

虽然我不是搞技术 ,但是我们看过去这几年的发展来讲 , 大模型的技术研发的演进越来越偏近是个工程问题 。

那工程问题它涉及到的可能是取舍 , 选择在某些关键节点上的策略的偏好 , 它可能不是要解决那个 0 到 1 跟纯天马行空的问题的状态 。

所以当它越来越偏向工程跟实施的角度来讲 , 它确实可能美国人的方式就是氪金堆 , 那中国可能就是找一些弯道超车 , 找一些取巧的方式来做 。

但是这两条路本质上讲也会慢慢的交融 , 就是我们这边找到一个什么样的方式 , 那边也会马上学过去 。

反过来讲 , 那边通过大力出奇迹堆钱的方式做出一些什么效果 , 我们可能也会尝试 ,但你发现尝试过程中可能我们的成本也在量级的提升 。

所以你发现其实过去这一年, 当然 DeepSeek 一直以来都不做太对外的太多的表达 , 那你看千问的逻辑其实已经是更偏那边的逻辑 。

所以吴妈讲的更多还是 KPS 的投入 , 对吧 。 虽然可能千问也有很多所谓奇心计巧 , 对吧 ,但是它的叙事就是揉杂了这两种叙事不同 , 然后堆起来的这样一个状态 。

所以你说谁对谁错 , 我觉得没谁 , 没有谁对谁错 , 互相学习 , 互相模仿 , 互相演进 。 但是问题在于这里出现了一个很简单的逻辑 , 对吧 。

大家谈论这轮 AI 算法 、 数据 、 算力 , 只有算力是可以靠堆钱解决的 , 算法和数据很难 , 算法尤其难 , 数据可能还好 。

Koji 杨远骋22:08

还有一个人才是可以靠堆钱去吸引的 。

庄明浩22:11

那天我看谁说 ,他说没有公司是通过给天才的员工开高价破产的 , 没有任何一家公司是因为这个事情破产 。

所以然后你就是 , 所以这就回到刚才我无数次强调一个问题 , 就是我们不知不觉在很多事情上走到了极限之后, 你发现你回头一看 ,有别的方式能更不需要花那么多钱 。

那我觉得小扎认清这件事情 , 我一年 KPI 投入大几百亿美金 , 然后我这个竞争看上去这个军备竞赛只是 25 年、24 年开始 , 还要继续滚几年不知道 。

虽然我的现金也够 ,但是我发现我哪怕把整个硅谷能挖到人挖空了 , 我也花不了这个钱 。 所以它的策略变成了那个样子是有原因的 , 对吧 。

我不会因为给那么多人开那么高的工资把这个事情干掉 。 所以你看他最近那个 Mira 的那家公司的联合创始人直接就去了 Meta, 你要知道那家公司已经 120 亿美金了 , 它是联创 , 它 10 个点吧至少 。

Koji 杨远骋23:02

是的 。

庄明浩23:02

对吧 , 它身价已经十几亿美金了 。

Koji 杨远骋23:04

但是 Sam 给的钱你记得是多少 ?

庄明浩23:06

是 3.5 个 B。

Koji 杨远骋23:09

对啊 , 所以 。

庄明浩23:10

35 亿美金 。

Koji 杨远骋23:11

所以它肯定超过原来的数字才能走嘛 , 所以对吧 。 很夸张 。

庄明浩23:15

太夸张了 。

Koji 杨远骋23:16

所以 anyway, 我们后面可能也会再稍微聊一聊中美之间的竞争 。 我觉得美国在今天就是有更多的资金放在这里 。

庄明浩23:25

所以你看上个季度广明跟小军的那个对谈里面讲得很清楚 , 就是美国的金融家或者犹太人的金融家 , 华人的工程师 , 就是这种 AI 趋势最大的代表 , 对吧 。

就这两件事情绑在一起 , 就是今天我们发生所有事情全部解释得清楚 , 就至少在美国全部都显示清楚了 。

多模态23:42

Koji 杨远骋23:42

我们刚才聊了大语言模型 , 我们现在再来聊一聊多模态这个战场 。 我觉得今年这个 Google 先是发了 V3, 然后这个 OpenAI 发了 Sora 2,他们在模型的进展和模型产品化的这两个方向上都做出了让大家这个感受到很振奋的一些进步吧 。

对 ,但同时其实各个厂商 , 只要有钱的厂商全部都在干这个事情 。 我比较想我们来探讨一下, 就是在如此红海的竞争里面 , 大家做的事感觉也比较同质化 。

明浩你会觉得这个决定性谁能胜出的因素会有哪些 ?

庄明浩24:21

我觉得多模态今天这个时间点 , 图片跟视频已经算混在一起来做探讨了 ,因为已经分不开了 。

然后在这个战场里 , 确实中美两国之间的竞争会比纯语言模型那个竞争更激烈 ,因为中国的厂商的能力看上去在一段阶段内显示出来非常强的状态 。

那抖音 、 快手 , 包括那几家初创公司 ,Video、Pixverse, 对吧 。 然后大家在这个板块的竞争出现了一些起头并进的状态 , 就你今天推出一个新的功能 , 你像 VO3 推出了这个这个深化同步之后, 大概三个月 , 三个月不到 , 可灵跟那个字节的模型其实就跟上了 。

就是跨时代的这种东西 ,但凡被定义清楚 , 马上就跟 。 然后 Sora 2 出来之后, 大家谈论什么时候我们能看到国产的类似的东西 , 可能两个月 , 我觉得两个月可能差不多就够了 。

就但凡一件事情被定义清楚 , 无论是产品边界 , 还是技术选型 , 还是技术路线的确定 , 中美两国在多模态这个板块的竞争确实非常强 。

然后又因为这个板块的落地 , 或者说场景的东西特别的明确 , 所以它会第一时间渗透到链条当中, 对吧 。

语言的 , 刚才还有什么法律 、 金融 、HR, 你还要调 , 还要试 。 可是图跟视频的应用跟用 , 很简单 , 你看美图过去一年的股价就好了 , 你看有多少公司在做什么营销视频的 Agent, 对吧 。

就是这个东西不需要再去论证跟验证什么场景 , 就它已经是一个非常成熟的极化的东西 , 就在那 。

你但凡模型能力提升 , 跟这个效果 , 无论是可控性也好 , 成本也好 , 它到了一个节点 , 它就会马上进入到渗透到链条里 。

所以它是一个 , 我觉得是一个体系化的竞争 。 那中美两国在这个事情上确实有不同的资源禀赋 , 我们的短视频 , 对吧 , 我们的短视频衍生的整个的生态链的丰富程度 , 包括可能跟电商 、 跟营销 、 跟各种各样场景的结合 , 甚至工具化的变化 。

就这轮关于图片视频的工具化的迭代 ,其实也很 , 我还是那个观点 , 你要想移动互联网 ,APP Store 出现的第一天 , 摄影这个品类就一直是打的最激烈的品类 ,有连续多少年最佳 APP 都是摄影类的相关的 APP, 对吧 。

Koji 杨远骋26:34

而且永远都有新的 APP。

庄明浩26:35

对 , 永远 , 你看打到今天还有 。

Koji 杨远骋26:37

2024 年的一个最佳 APP 都还是一个摄影的 APP。

庄明浩26:39

打到今天还在打 , 那就代表这个东西确实太硬了 , 它太多的需求 , 太多的场景 , 太多可以被施展的地方出现了 。

所以就是那房地产对于厂商而言 , 它的挑战就变成了你到底要做什么 , 对吧 。 纯技术本身的演进 , 它有些难度 ,有些难题需要克服 , 这个没有问题 ,但是再衍生一步 , 你去落在那 , 你用来干嘛 ,是做 to B 还是直接 to C, 对吧 。

那 Sora 2 出现之后, 你会发现有一些声音会觉得它超了一个抖音 , 对吧 。 那偏正面的观点 , 大家会说它在尝试用今天这个时间点 , 普罗大众已经被教育的非常成熟的一种交互形态 , 让 AI 加成或者说加 buff 的方式来做 ,而且在很短的时间内 , 用看上去很简单的实现路径做出来 。

因为你要知道大家做产品就是说加功能是简单的 ,但砍到一个合适的边界里面 ,并且打包好 , 这个是难的 。

对它对那个产品经理的对用户的需求的感知把握 , 交互的设计 , 它要求是一个非常复杂的事情 。

Koji 杨远骋27:41

这还是非常佩服 OpenAI 的 。其实你说做到这样的模型能力的公司 , 我们刚才盘点的时候一直没有提到 MiniMax。

庄明浩27:47

对 。

Koji 杨远骋27:48

然后 MiniMax 大概在半年前吧 , 就有海螺的一个视频模型 , 当时有一个非常出圈的代包款 , 就是这个小猫猫跳水参加奥林匹克 , 对吧 。

它的体操动作的那种还原也是很世界领先的 。 但是大家那么多的厂商 , 做了那么多很牛逼的世界模型 , 那么厉害的这个视频模型之后, 只有 Sora 2 出来 , 然后 Sora 2 是真的走进了千家万户 , 就离开了 AI 圈子 , 让大家认知到 。

庄明浩28:13

但最近又有另外一个就是说 , 这件事情可能也是因为是 OpenAI, 就其实也有一些可能不是厂 , 比如不是模型厂商自己 , 是一些第三方厂商也之前做过类似的尝试 , 当然可能更多在图的那个板块 ,而不在视频 。

但是可能是因为他们不是 OpenAI,不是最大那几个家伙 ,他就没有办法像 OpenAI 的 Sora 2 这样得到这样的关注 。 之前多模态领域 , 六角龙有一家是一直打多模态 , 就是街月嘛 。

那街月除了做模型之外, 做了一个图片社区嘛 , 叫离谱嘛 。其实 。

Koji 杨远骋28:45

现在整个离谱团队撤掉了 。

庄明浩28:47

对 , 然后其实离谱的数据初期发展是不错的 ,其实还可以 。 然后无论是留存 、 活跃很多事情 ,但是因为各种各样原因 , 它没办法继续下去了 。

那可能就是因为我们刚才聊的上面那些事情 ,但是并不代表之前没有人尝试过 。 有很多人尝试过 , 可能那个时间点 , 很多人对这件事情的认知跟判断不会像今天 Sora 2 出现之后, 会把这个事情的乐观 , 比如原来乐观指数是 30 分 , 今天可能提到 60 分 。

Koji 杨远骋29:14

对 ,因为原来捏它也好 , 离谱也好 , 仍然是二次元的一个圈子嘛 , 它并没有泛化 。 那没有泛化 , 大家会想象 , 第一个是可能我们也看不太懂 , 第二个是也会觉得天花板还是就在那里的 。

庄明浩29:25

对 , 所以那天那个 Sora 2 出现之后, 我的评价其实特别简单 , 就是说就这些声音确实你同意 , 就是说大家很多媒体标题说我们不需要一个 AI 抖音嘛 , 就这最常见的媒体标题 。

就是我觉得这块没有问题 , 就是确实我们拿抖音已经非常成熟的这套体系 , 无论是它的内容生态 、 留存 、 交互 、 乱七八糟 , 跟它已经覆盖的人群 、 影响力 、 商业化 , 就是我们确实这个世界上不需要一个 AI 版的抖音 ,不需要了 。

但是访问量对于 OpenAI 而言 ,Sora 2 是需要 , 就是它需要一个独立的产品 , 把它的技术变成一个产品化落地的东西 ,并且以合适的边界做出来 ,并且让它内部的团队有机制 , 跟有方法不断的把它的技术的东西变成落地的产品 。

就是这个事情 , 这套运转的过程 ,SOP 乱七八糟 , 组织架构 、 人员这那 , 才是对 OpenAI 重要 。

Koji 杨远骋30:17

是的 , 所以我看到那篇文章标题 " 这个世界不再需要一个 AI 抖音 " 的时候 , 我当时的第一反应就是 , 这 OpenAI 也没有想做 AI 抖音啊 , 对吧 。

这个命题是你加给人家的 。

庄明浩30:27

那天也是 Sam 来讲 , 就是 OpenAI 在变得越来越复杂 , 它现在可能 , 或者说在它体系内有三四家公司 , 一家产品公司 , 一家技术实验室 , 一家技术设施公司 。

它正在最近一段时间在努力的是这家公司 , 然后可能还有一家叫其他 , 比如说硬件啊 , 什么一些新的乱七八糟的东西在那家其他公司 。

它可能同时在 , 所以就非常像投资人嘛 , 就是它 OpenAI 已经不是一家 , 它已经 5000 亿美金了好吗 , 它不是一家单纯的创业公司 , 一个样子就把它描述清楚 。

它现在已经至少有四个实体了 , 对吧 , 一家产品公司 , 已经 CEO 都找到了 , 技术实验室 , 那是它最最最原始的东西 。

然后它马上,Sam 最近一段时间在忙的事情是 Inpher 这家公司 , 那这家公司现在确实是满足 OpenAI 自己的需求了 。

但到极限状态呢 , 如果真的几万亿美金砸下去 , 这家公司的能力没准是可以富裕到其他公司 。

Ronghui31:19

我不知道你们有没有看那个在 X 上, 就是它那个发布会那天之后, 各大就是我们所熟悉的那些公司 , 什么 Figma 呀 , 然后那个 Library 啊什么的 , 全部都在晒 OpenAI 送给他们的那个那个像奖章一样的东西 , 不同的颜色 。

Koji 杨远骋31:35

使用了超过多少 token 的那个 , 我觉得他们太会做营销了 。 你记得去年我们有一次想做一期选题吗 , 就是那个时候很多人骂 Sam Altman, 觉得他是营销狗 ,但当时我们就想做一期选题 , 就是跟 Sam Altman 学营销 。

Ronghui31:49

我觉得就是 Sora 2 的那个视频 , 我都感觉就是在这个公司已有的资源 、 传播资源的基础上做了一个刚刚好的尝试 。

就是我也不越界 , 我也不搞乱七八糟的东西 ,但是我就用我创始人的这个 IP,其实我觉得它在某种程度上哈 , 我觉得它有点像 Elon Musk, 就是你们随便怎么恶搞我我无所谓 。

Koji 杨远骋32:11

反正它想得清楚嘛 。

Ronghui32:12

对 ,但是这个能给我的这个公司的 ,不管是公司还是 IP,因为你每一次互动都会给你个感觉 , 就是你在跟 OpenAI 互动 , 就是你都在跟 OpenAI 进一步的绑定 。

Koji 杨远骋32:23

我们其实你看聊到这里 , 我们真的聊了大量的和 OpenAI 有关的话题 。 不知不觉这个世界还是被它在影响 ,不管中间出现了多少波折 , 出现了多少曾经不看好 , 甚至好像共识不看好的声音 , 还是很佩服的 。

但我们还是想聊一聊 Google,因为今年就像我刚才提到十字路口写了一篇文章 , 我发现 Nellis 他们的播客最近也做了一个大选题 , 就是 Google 怎么样 。

庄明浩32:48

DeepMind 的那个 。

Koji 杨远骋32:48

对 , 触底反弹回来的 ,他们采访了 DeepMind 的一个高管 。 然后 Google 这一次回来有很多的信号 ,不管是 Nano Banana 还是 Veo3,但我们想聊一下的是这个它的世界模型 。

它发了 Genie, 发 Genie 的时候看到也是有一种就是全身通电的感受 , 就怎么可以做得那么厉害 。 只是 Genie 现在因为离商用还有点远 , 所以这个发了之后呢 , 没有太多后续 。

但是也很想听听明浩你会怎么看这一系列世界模型 。

庄明浩33:18

就是我觉得这个问题再往前推一点啊 , 就这个问题可能又有点上升到哲学或者是更宏观的角度来讲 , 就是自然语言模型这轮出现之后, 很多的科技人甚至哲学家 , 甚至很资深的从业者会认为 , 当机器掌握了语言这个人类特有东西之后, 那个所谓的超级智能就来了 , 这是一类观点 。

所以这一轮的大语言模型的发展的最底层的基础逻辑是这个 , 就是语言是人类特有的 , 它可能建造了所有的文明 , 所有的这些事情都是基于语言的 。

但是呢 , 发展发展出现了一个第一个分支 , 或者说我们不好说它是子集还是并行的 , 叫 Coding, 就是有一派认为 Coding 是语言的子集 ,但另外一派会认为那是建立一个新的世界的可能性 , 那我们不好 。

然后再往前发展出现了多模态 , 然后多模态的时候大家会发现 , 语言再怎么好 , 深入描述得清楚 ,但是很多别的感觉器官得到的东西是没有办法通过语言的 , 视觉是最大的一个 。

所以视觉出现之后, 多模态这个板块从语音到图片到视频 ,3D 到今天的世界模型 , 我觉得它是一个从我们刚才讲了好几个关键词 , 语音 、 图片 、 视频 、3D, 这些是局域战场 , 局域战场打包在一起的终极 , 变成了世界模型 。

所以 DeepMind 的那个核心高管之前接受采访时说 ,他会认为世界模型是另外一个我们通向 AGI 的路径 。 就是如果我们用打斗桌的方式来讲 , 语言是一桌 , 我们叫主桌 ,Coding 不好说是主桌还是分桌的子集 ,但有一派观点 , 或者 DeepMind 认为世界模型是另外一个主桌 , 就是它会变成 , 它有个比喻是说类似世界的子宫 , 大概是这样一个比喻 。

就是它会认为如果那个东西真的出现了 , 它符合人类的所有的物理学定律 , 它能在可见的时间内生成 , 它比你消耗的时间更快 。

就是因为现在还慢嘛 ,因为你要等嘛 ,但如果某一天技术能得到到你想就出现 ,并且比你想的快 , 严肃法学嘛 , 那似乎哲学念想就出现了一个新的东西 。

然后当然这是一个极度理想 , 技术理想主义的结论 ,但确实我觉得 DeepMind 就是往那个方向走的 。 因为你要知道 DeepMind 在这轮自然语言模型之前干的事情也是这个事情 。

Koji 杨远骋35:44

是的 , 还是引领创新 。

庄明浩35:45

对 , 包括李飞飞也是这个逻辑 , 就是李飞飞的创业公司也是做世界模型 。 所以当这个逻辑出现之后, 那就会有一派的观点会认为 , 如果世界模型也是主桌 , 那它可能用另外一种方式会实现所谓的 AGI。

如果真的实现那个极度理想的那个状态 , 那确实这个事情太可怕了 。 如果我们把时间拉长周期来看 , 上一代 AI 公司都是解决视觉 , 那视觉的应用场景 , 刚才我们讲图片也好 , 视频也好 , 本来现存的场景的满足已经是一个巨大无比的事情了 , 它都不需要做新的事情 。

所以那这个逻辑摆在这里 , 无论跟游戏结合 , 跟现在的视频 , 就是它瞬间就挂上了 , 只不过现在这个时间点技术还没有 ready, 还没有到所谓的临界点 , 所谓的像 GPT-3.5 的这个时刻 。

所以当然这个东西大家也知道很难 , 它可能比语言模型还难 。

Koji 杨远骋36:33

除了 DeepMind, 除了李飞飞的 Road Lab, 国内有谁在做世界模型吗 , 据你所知 。

庄明浩36:38

浑源在做 , 就浑源的世界模型刚刚发 ,是 0.1 的版本好像 , 就是非常早期 , 还处于我们单纯只能把一张照片变成一个可互动的那个样子的东西 , 很早 。

而且你看上去就那个图片的质量 , 包括那个像素的那个清晰度 , 还处于非常非常早的阶段 。 但是我觉得就跟刚才我们讲的逻辑是一样 , 就是图片视频可能今天战场已经相对比较激烈 , 已经走到这儿 ,但是 3D 跟世界模型还处于 ,3D 可能更快一点 ,但是没有那么快 。3D 跟世界模型绑在一起 , 这个战场里的这些公司 , 游戏公司会比较多 ,因为他们有天然的需

求的 。

Koji 杨远骋37:16

那天听到一个数据啊 , 就是说这个拓竹他们有一个自己的这个平台嘛 , 用户使用拓竹去生成 3D 模型再打印出来 , 就是它可以调浑源 ,也可以调 Masked, 还可以调其他很多家的选择 。

然后现在他们是浑源也好 ,Masked 也好 。

庄明浩37:35

最大的 。

Koji 杨远骋37:36

比较头部吧 , 的一个这个调用量 。 所以一方面他们的这个 3D 模型的客户是游戏 , 另外一方面其实是 3D 打印的这些用户嘛 。其实多模态创业还是是一个非常热的一个赛道嘛 。

就是我们看到今年出来了一个 Higgsfield, 然后包括现在 Higgs 的 founder 也做了 Polo, 然后他们的这个数据收入跑得都很好 , 量也很大 。

然后前段时间我这个就红杉的一个背投 , 然后他们上了一个新产品 , 一个这个视频的一个工具的一个产品 。 然后当时我就问他差异化是什么 , 前面有那么多的这个 , 比如说 VEED 为代表特别特别多 , 然后他说差异化没有那么重要 , 然后这个市场太大了 。他当时给我讲的一个数字 ,他说这个现在 TikTok 在全球每日的新增是 100 万用户 , 然后这 100 万用户里面有 12% 的人

会去点中间那个加号 , 就是每天全球有 12 万新的视频创作者 ,不管他多草根 ,他都叫视频创作者在产生 , 这些人全部需要工具 。

对 , 所以他当时讲的另外一个数字 , 就是在这个视频工具的领域 , 当时超过 2000 万美金的 ARR 的公司已经有 20 家 , 很多是我们所不知道的 。

庄明浩38:50

对 , 没听过 。

Koji 杨远骋38:50

它可能解决了某一个具体的问题 , 或者它在某一个具体的国家 。 所以多模态还是一个非常有意思的一个地方 。

然后我们在复盘 2025 的时候啊 , 我觉得也有一个除了 DeepSeek R1 之外不得不讲的 , 属于所有中国人的回忆 , 就是 Manus 的发布 , 这个 Agent 成为了一个年度的重要的关键词 。

Agent39:11

Koji 杨远骋39:11

然后十字路口今年有一个开年播客 , 当时我们和雨森聊的时候 , 那个播客的标题就叫做 《Agent 的元年 》。

我们现在回头看也觉得我们还挺厉害的 ,但当时其实我们也冒着风险 ,因为如果这一年不是元年的话 , 我们就活生生被打脸 。

对 ,但还好啊 , 今年 Agent 的发展确实不错 。 然后发展到今天呢 ,也会有很多的声音出现 , 比如说到底要通用还是要垂直 , 比如说这到底是不是 ChatGPT。

庄明浩39:36

还是独立公司 。

Koji 杨远骋39:37

会不会吃掉你们这所有的这个 Agent 的厂商 。 对 , 所以聊到 Agent 想听听明浩你有哪些观点想讲 。

庄明浩39:43

首先还是回到刚才那个 L1 到 L5 的这个分类 ,L3 是 Agent 嘛 , 就是当所有人实现了 L2,L2 形成所谓的所有人都有之后, 那当然就会往 L3 走 。

就是这是一个很简单的逻辑 , 只不过走 L3 的时候大家出现了一个问题 , 你会发现 L1 到 L2 还是语言的问题 , 还是语言本身的问题 ,但 L3 变成了行为 。

就是原来是对话就解决了 , 哪怕是推理也是对话就解决了 ,但是到了 Agent 呢 , 我们要它干活了 , 干活这个事情就变复杂了 。

就它是有行为的 , 它的行为无论是在计算机上, 还是在网页上, 还是在数据库里 , 还是在什么地方 , 它是要有行为的 。

行为就不单纯只是吐几个字就解决的问题 。 所以你会发现 L3 虽然今年是元年, 但没准有可能未来五年都是 Agent 的元年, 都有可能 , 就跟 VR 一样 , 未来五年都是 Agent 的元年 。

就是或者说就跟自动驾驶一样 , 我们要在 L3 待很久 ,有可能 。 因为虽然 Agent 是一个阶段 ,但是它涉及的细分的阶段也有很多 , 就什么层级的 Agent 也会有非常多不同的区别 , 跟不同的体验以及不同的要求 。

那你可能又涉及到刚才我们聊的是通用还是垂直 , 还是再垂直到某些小的场景里有更容易实现的 , 理想化 Agent 的实现 , 对吧 。

所以那这个角度来讲 , 我觉得这一段话是关于 Agent 这个概念 。 然后再往前推 , 就是 Agent 给了非模型厂商公司网银场景落地里面的一种范式 , 就这个是重要的 。

就是说原来很多初创公司或者说想创业的人, 想在 AI 领域做公司 ,在之前纯模型竞争的角度来讲 ,他都不知道干嘛 , 或者说他可能能做的事情就是套壳 , 就是上个时代大家讲的套壳 ,但套壳不是个贬义词 , 就是他能做的事情就很少嘛 。

但是今天你发现 Agent 的生态的崛起是非常大的 , 非常复杂的 , 那它复杂到如果我们类比当年的互联网的话 , 可能今天连协议都是非标准的 。

所以有很多公司在做协议的事情 , 尤其以大公司为主 , 对吧 ,Cloud 也好 ,Google 也好 , 那你说 OpenAI 不想做吗 , 它肯定也想 , 只不过被人抢了 , 对吧 , 没办法 , 当形成事实标准 , 协议就出现了 。

那协议有 , 然后你发现因为我们要从语言到行为 , 行为的时候就需要你要做很多的我们叫脚手架 , 对吧 , 这个 。

Koji 杨远骋41:56

Infrastructure。

庄明浩41:56

Infrastructure 也好 , 实施也好 , 去兼容现有的这套为人类设计的互联网的整套的东西 , 还是说我们新建一套什么东西 , 这个东西这个中间也有分歧 , 我们到底是用浏览器还是不用浏览器 , 对吧 ,是纯 API 对接还是怎么样 , 所有的这些选择题打个勾一样 , 打完勾每个公司就出现了千差万别的区别 , 然后各种各样的公司全部都出现了 。

然后也有做纯协议层的 , 纯帮你做 Infrastructure 层的工具的实施的 , 然后也有做 Infrastructure 本身的 , 然后也有做记忆系统 。

就是你会发现这个事情因为我们要往那走 , 所以要的东西特别的多 。

Koji 杨远骋42:33

讲到 Memory 有一个特别有意思的点 , 就是十字路口之前我采访了 MEMU。

庄明浩42:36

对 , 我知道 。

Koji 杨远骋42:37

然后在采访他之前呢 , 我觉得要做一些功课 。

庄明浩42:39

太多了 。

Koji 杨远骋42:39

记忆的这个 Infrastructure, 然后当时这个和 MemoBase 的 founder 也认识 , 然后我就约了一个 call, 我就请他给我科普一下, 然后他科普完之后我就听起来 , 我说好像每个公司的技术路线都不一样 。他说是的 , 现在都没有统一的技术路线 , 每个人做的路线都不同 。

庄明浩42:57

我们也在做 ,因为我们主业做社交嘛 , 我们也做 AI 社交 , 那 AI 社交里面有一个很重要的就是 Memory 的问题 , 无论是自己的 Memory 还是你跟别人的各种各样对话 , 跟你就是 , 然后我们的那个技术团队的那个 ,他不是技术团队 , 就那个团队的负责人就特别头疼 , 就是他头疼的问题变成了一个 , 我到底这个事情是要自研 , 还是用一个开源的方案 , 还是

用一个成熟的 AP 厂商 , 连这件事情的选择他都没有办法做决定 。

Koji 杨远骋43:23

答案在风中飘 。

庄明浩43:24

就是没有 , 就他没有 ,他都没有根据跟去如何评判这件事情的标准 。

Koji 杨远骋43:30

因为赵全响在我们上次北京场的 AI 开放麦 , 然后来十字路口也讲了十分钟 , 然后他讲的主题就是他自己在做一个新的项目 , 叫做是一个 IM。

庄明浩43:39

我知道 , 我知道 。

Koji 杨远骋43:39

然后这里面也需要用到记忆系统 。

庄明浩43:41

对 。

Koji 杨远骋43:41

然后他那十分钟分享的不是他那个 IM,而是他为了 IM 而做了一个自研的一个记忆系统 ,因为他觉得现在市场上他能看到的可用的都不行 。

庄明浩43:49

对 , 或者不适用 。

Koji 杨远骋43:50

他要自己来 。

庄明浩43:50

或者不适用 。

Koji 杨远骋43:51

不适合他 。

庄明浩43:52

对 。

Koji 杨远骋43:52

所以你看这只是 Memory 一项 。 我记得前一段时间那个蚂蚁开源不是做了一张巨大无比的开源的图吗 , 就是 Agent 的框架 ,Agent 的 Memory,Agent 的 Infrastructure, 所有这些是过去这一年整个开源生态里面涨得最多的几个板块 。

因为确实大家就走到这了嘛 , 就是你就是要解决这些问题 , 它就跟冰山一样 , 我们看到的确实是冰山上面那个 Agent 的那个东西 ,但是那个冰山下面是巨大无比的一套东西 , 太多了 。

因为现在很早 , 没有人把这个生态建立得那么 , 你很多东西真的没办法只能自己搞 。

庄明浩44:25

对 ,也只有在这样的时候你才可能就是赢得一些创业公司所独有的一些竞争优势 。

Koji 杨远骋44:31

这块我有一个好奇的问题 , 我不知道你们有没有这种感觉 , 就是我觉得 OpenAI 虽然它也专门在讲 Agent 这件事了 ,但是后来很克制 。

庄明浩44:38

是不是 Agent 可能对于他们的决策体系里面不那么重要 , 就是他们可能更多还是想的 , 比如古典互联网产品经理想的事情就是需求 、 实现跟产品的样子 。

但是 Agent 相当于 , 我觉得 Agent 在今天的现代某种程度上被狭义的框死了 , 就是它的 , 比如它的交互 , 它的产出结果 , 它的那个按钮的样子 , 甚至某种程度上说被这一年左右时间框住了 。

那你反过来 OpenAI 也在做一些调整 , 对吧 , 它也出了自己的 Agent, 包括把原来那个什么 Operator 改成了今天那个样子 , 对吧 , 包括原来 DeepSeek 做融合 , 就是可能它原来也没有想过 Agent 应该是什么样子的 , 就没有人知道是什么样子 ,但是慢慢慢慢慢慢可能从 Manus 开始 , 我觉得 Manus 最大的意义在于 , 或者说回头来看 3 月份发布到今天 , 它最大的意义在于让用户大概知道 Agent 应该

是什么样 。 这个东西是 , 当然你说的更细一点是可能是交互 , 可能是版面设计 , 可能是什么东西 , 可能是 UI, 对吧 ,UE 乱七八糟 ,但是至少那个东西包出来那个样子 , 告诉大家 Agent 差不多应该是这个样子 。

Koji 杨远骋45:41

而且在今天这么一个时代 。 成为大家心智当中你就是谁的 。

庄明浩45:46

对 , 代名词 。

Koji 杨远骋45:47

代名词这个有巨大的红利 , 所以今天 Manus 能够最近他们发布 9000 万的 ARR 嘛 ,9000 万美金 , 这个其实我觉得这个后面当然追随者非常多 , 然后也有很多人带着甚至不懈的这种口气说我三周还是三天复刻一个 Manus,但是这个你不可否认最后一个事业的成功它不只是靠这个产品 ,不只是靠研发 , 它其实很多时候是一个综合的一个能力 , 这包括实际的选择 , 包括

细节的打磨 , 就是也有很重要的就是品牌的打造 。

庄明浩46:19

是 , 就所以又回到刚才那个问题 ,Chatbot 的品牌已经这样这样打完了 ,但 Agent 这样这样还在打 , 对吧 , 只不过 Manus 占了一个先机 ,而且确实占得比较 , 我觉得比较硬 。

Koji 杨远骋46:29

对 , 夏天的时候有很多人说感觉 Agent 有点凉了 , 你会有这种感觉吗 ?

庄明浩46:35

如果大家有印象的话 ,GPT-5 应该是 8 月份发的 , 然后 Cloud 的那个版本也是那个 , 就 8 月份是美国头部生产厂商都发版本的 ,7 月份是中国的大部分模型厂商选择开源模型发布的最重要的一个月 , 几乎 7 月那一整月每天就没有停过 , 就是今天你发 , 明天我 , 你大家回想就是翻那个月度总结 ,7 月份就是疯狂七月 , 就是以中国的开源厂商为代表的疯狂七

月 。

Koji 杨远骋47:01

那个时候 MiniMarket 还有一个发布周 , 一周就可以发 。

庄明浩47:04

对 , 就是那个一周 , 什么质谱 , 国内的 Keyme, 所以七八月份大家又焦点又拉回到了纯模型本身的竞争上, 所以那 Agent 那时候太忙了 , 那很多公司发了产品开始做用户 , 做 AR, 做实施 , 包括 Infrastructure 公司拿点钱 , 可能又做别的事 。

Koji 杨远骋47:19

我只能说这个注意力肯定不如这个 Manus 刚发布那种刷屏的注意力 ,但是你说它凉了 , 我觉得肯定是没有的 ,因为在后面这个 Manus 非常硬的发了他们的 ARR 嘛 ,并且提了一个概念叫 RRR, 对吧 ,也不是他们提的 , 只是给大家科普了一下 ,有这么一个更科学的看自己收入的规模的一个数字 。9000 万美金啊 , 这个很了不起啊 , 这个成长的曲线应该是超过了我们熟知的

大多数的这个我们认为成长非常快的公司的 。 然后就在上个礼拜吧 ,A16Z、Speedrun 他们 005 有一个 Demo Day, 然后 58 家创业公司每个人两分钟在 LA, 很多区的人都在推特和极客上说感觉比这个 YC 的 Demo Day 质量还要高 , 对吧 ,而且我觉得也很有可能因为 A16Z 确实更有钱 , 它可以塞到更头部的更成熟的创业者 。

然后当时我有朋友在现场就录了音 , 然后发回来 , 我让 Gemini 做了一个总结 , 然后就说这个创业公司可以分成哪几类 , 对吧 ,Gemini 说就三类 , 然后第一类就是叫 Agent as a Service, 就大家在做各个垂直行业的解决不同问题的 Agent。

对 , 所以我觉得你说它凉了只是确实没有在不断的刷屏让你感觉天天这个被震醒 ,但是我觉得它已经渗透到了这个今天就是五花八门 、 百花齐放的各种创业的热潮当中 。

庄明浩48:42

然后同一时间 A16Z 不是发了那个搒单 , 就 A16Z 每半年会发那个流量的搒单嘛 , 它最近发了跟一个厂商合作发了一个那个 。

Koji 杨远骋48:50

收入搒 。

庄明浩48:51

初创公司的收入搒 , 就是它所能够覆盖 , 就那个第三方厂商它是一个做数据跟支付的公司嘛 , 它所能够覆盖的这些偏初创的公司把钱花在了哪些其他的 AI 公司上的搒单 , 然后中国公司有四家我没记错的话 , 简映 、 可灵 、Manus, 还有一家是谁 ?

Koji 杨远骋49:09

JetSpark。

庄明浩49:10

对 ,JetSpark, 对 , 这四家好像是 。

Koji 杨远骋49:12

对 , 然后说到 Agent 呢 ,其实各个手机系统也在做自己的 Agent。

端侧智能49:12

庄明浩49:15

对 。

Koji 杨远骋49:16

然后这里面我觉得比较值得注意的有一个是鸿蒙做的小艺 , 然后我觉得原来啊 , 从 Siri 开始啊 ,2012 年 Siri 发了之后 ,其实手机都有这样的语音助手 。

庄明浩49:28

对 。

Koji 杨远骋49:28

但是和今天的一个 Agent 比起来 , 我觉得还是有一个代际的差别的 。

庄明浩49:35

我觉得这个跟跟我们刚才讲是一脉相承的 , 就是首先是语音模型的进展变得更强了 , 第二呢 , 就是这一轮的语音模型进展是端到端的 。

我觉得大家有印象应该是当年 GPT 哪个版本的最大的那个演示就是那个语音对话 。

Koji 杨远骋49:52

打电话 。

庄明浩49:52

就是那个是一个最强的感觉 , 所以语音的端到端的模型的进展是很强的 。 再一点还是刚才我们说的那句话 , 自然语言 , 就是这一轮 AI 模型的进展从 L1 到 L3 的变化叫从语言到行为 。

行为是什么 ? 对于手机厂商而言 , 就是你去操控所有手机内部的所有这些东西 。 就是你要知道刚才我们讲的是一个更泛层级的行为 , 可是对于一个手机厂商而言 ,在用户的手机内的行为 , 那这件事情就应该手机厂商自己来搞啊 ,不可能给一个第三方厂商的独立的 App 来去做嘛 ,因为这个权限 、 安全 、 隐私 、 乱七八糟这些事情 , 只有手机厂商自己来适

合 。

Koji 杨远骋50:27

对 , 如果说之前 Siri 还是在叫做这个比较抽象一点说啊 ,以用户指令为中心 , 它不会去解读你背后的意图 , 那其实今天比如说鸿蒙做的这个小艺 , 它会去解读用户的说的这个指令背后的意图的 , 然后根据意图再去执行任务 。

庄明浩50:42

对 。

Koji 杨远骋50:43

然后这里还有一个我觉得鸿蒙做的和别人不太一样的地方 , 就是他们做了一个智能体框架 , 这个名字叫 HMAF, 然后什么意思呢 ?

就是每个 APP 不管你是美团还是你是携程还是你是京东 , 你都可以去注册自己的 Agent 的 API, 这样当小艺收到一个用户的指令的时候 , 它会把这个指令背后的意图识别出来之后, 再下发给各个 APP 的 Agent, 所以这也不是 OS 自己去做所有的事情 。

庄明浩51:10

是 。

Koji 杨远骋51:11

今天美团出了小美 , 那京东其实也有自己的 Agent。

庄明浩51:14

对 ,是的 。

Koji 杨远骋51:14

那所以比如说再举一个具体的例子啊 , 就是如果今天我对鸿蒙说小艺小艺给我推荐一款适合老人的电饭煲 , 然后如果这个我的手机上有京东 , 京东的 Agent 就会被小艺调起 , 然后京东再在它的 APP 里面去完成一个 Agent 的这些行为 。

庄明浩51:33

就总的来说 , 我从一个用户的角度哈 , 可能感受到的就是小艺可以理解我接下来要做什么 , 那这其实也给开发者创造了很多发挥的空间 , 比如大家都在说未来可能是智能体之间的互动 , 那鸿蒙也在 6 月的时候发布了小艺智能体开放平台 , 提供了蛮多的组件和能力来让开发者捏出自己想要的智能体 。

跟刚才我们讲的确实一样 , 就是如果我们只把整个一套网的这个生态变成一个生态的话 , 那确实在生态当中, 因为现存的 App 是一种已经体验被封装好的东西 , 然后呢 , 手机厂商的用户识别 、 权限 , 然后包括场景的落 , 它不可能所有东西都做 , 它一定是跟现有的已经非常好的和已经做好这个场景下的东西来做合作 , 来去做 , 就跟 OpenAI 的 ChatGPT

去跟那些厂商合作 , 它逻辑是一样的 , 就是你不可能把所有事情都做了 , 然后呢 , 确实在中国的这个 , 我们在中国的语境下, 中国的互联网的 App 的成熟度的这件事情确实是更领先的 , 所以在各种各样的场景里面 , 你做的事情 , 你只需要把前面的需求分析某种程度来说做得好的话 , 就一定会有很好的服务商给你提供这个服务 , 那它的服务的实

现可能是通过它自己内部的无论是 Agent 也好 , 搜索也好 , 还是古典定义的列表也好 , 来去帮你做这个实现 , 所以这套生态的建立也是建立在中国的整个移动互联网丰富的已有的这个生态基础上才有这个可能性的 。

开源生态53:01

Koji 杨远骋53:01

那今年有一个很明显的变化就是 , 那过去两年我们其实体验到的 AI 已经越来越多的开始在设备终端落地了 , 然后再加上 Agent 的发展也很迅速 , 所以对于设备厂商来说 , 结合 Agent 的能力是这些设备厂商都看好并且在押注的方向 。

我们前面聊了大模型 , 聊了多模态 , 聊了 Agent,其实已经非常丰富了啊 , 然后我们接下来再开始聊一聊这个生态 , 然后第一个生态是开源生态 , 那说到开源生态 , 我们一开始也提到就今年开源成了中国的 , 我觉得从上而下的一个这个 。

庄明浩53:36

共识 。

Koji 杨远骋53:36

共识 , 一个大的策略 。

庄明浩53:38

是的 。

Koji 杨远骋53:38

对 , 甚至最近我看到上海还出了一个政策 , 就是鼓励企业开源 ,不只是做开源产品 , 同时还鼓励大家做开源社区 , 然后给出的这个奖金是 500 万的现金 , 如果你在开源领域你的产品有足够大的影响力和流量的话 , 我觉得这个很有意思 , 当然这个前提应该还是 DeepSeek R1 的成功 。

庄明浩54:00

是的 。

Koji 杨远骋54:00

让大家都看到了一个中国公司如果要在世界舞台上面获得竞争力 , 开源是一个很可行的路 。 那明浩你会怎么看开源这个关键词在今年发生的这些事情和它带来的意义 ?

庄明浩54:13

对 , 就是其实去年就有记者应该问过 Sam Altman 怎么看开源和闭源 , 当时他的答案是说他会认为最领先的模型一定是闭源的 ,因为它需要巨多的钱 、 资源跟容量的问题 ,但当 DeepSeek R1 的叙事出现之后, 也出现了变化是说大家会认为开源模型的能力跟进得很快 ,并且最头部模型里面一定也会有开源模型 , 甚至今天前两天那个 State of AI Report 里写有一个预

测是说 2026 年一定会有一个开源模型拿到一段时间的第一 , 然后呢 , 你会发现 GPT-5 发布之后,GPT-5 的某几个系列的模型也开源了 ,OpenAI 也要不得不去做开源的事情 , 确实开源模型到了一定的基础能力之后, 确实闭源模型开源模型之间的边界的差异没有那么大了 , 然后成本又有巨大的差异的情况下, 无论是开发者也好 , 生态也好 , 整个的应用也好 ,因为

确实在这个时间点我们去衡量所有的模型 , 刚才我们强调的说可以打分 benchmark 什么的 ,但是最最重要的业界的生态意义在于有多少人用 , 它的 token 的消耗是多少 , 它的覆盖的厂商的数量是多少 , 这个才是它作为模型厂商在今天这个战场里最最最安身立命的根本所在 , 你模型再厉害没有人用 , 没有意义 , 对吧 , 所以从这个角度来讲 , 开源确实

在这个角度上给模型厂商提供了另外一种方式来去得到认可 , 得到关注 , 甚至帮助你的模型本身做改进调整 ,而且又因为你会发现原来大家认为的开源可能是不挣钱的 ,是偏理想化的 ,是那样的 , 可是今天开源并不代表它跟商业化没有关系 , 对吧 , 你 DeepSeek 是开源 , 可 DeepSeek 的 API 一样是卖钱的 , 你要去 to be the firm 你也是要去花钱的 , 虽然 DeepSeek 的可能 API

的成本可能 OpenAI 最后的模型可能是 100 倍甚至几十倍的差距 ,但是它认为它的成本 OK, 那它就可以这么搞 ,而且又因为整个生态的建设 , 对吧 , 你有开源社区 ,有更多的开发者也好 , 更多的相关的厂商也好 , 帮助你在改进你模型本身的 ,因为这个东西就是越用的越多 , 理论上来说它改进的可能性越高 , 所以在这个角度来讲 , 这是一个我觉得纯技

术 , 然后还有一个叙事是说今天是很公认世界范围内 AI 这一波竞争大概率就是中美两国之间的竞争 , 那中美两国之间竞争除了中美 、 中国跟美国本土的竞争之外, 更重要的可能变成了其他国家的竞争 , 欧洲可能特殊一点 , 那把欧洲抛掉 , 剩下那些国家怎么做处理 , 对吧 , 你总要有模型吧 , 那你模型用谁的 , 你当然可以用 OpenAI 的 , 你也可以用中国公司的 ,

你也可以用一个什么样 , 你日本怎么选 , 非洲的国家怎么选 , 东南亚国家怎么选 , 中东怎么选 , 那在这个角度来讲 , 开源可能也是一种双引号的武器 , 都是这样 。

Koji 杨远骋56:53

对 , 就当你是一个开源的一个模型的时候 , 你其实天然会得到更多的好感 , 然后也能够让更多人可以低成本的部署到本地 , 这其实也是让它可以更快的获得用户的一些这个用户获取 。

我觉得还有一个也是很值得讲的就是信任的建立 ,因为今天大家仍然会担心我的数据是不是这个 。

庄明浩57:17

出现 。

Koji 杨远骋57:18

对吧 , 出现泄露 , 或者我的数据被你拿去干这个干那个 ,但一个开源模型也天然的回答了这些问题 。

庄明浩57:25

所以这个引发一个更小的例子 , 最近不是双十一吗 , 然后我在看我想买一个那个新的笔记本电脑 , 然后看那个型号有一个专门的型号被迅速的买完了 , 为什么 , 那个专门的型号就是一个特别适合本地部署大模型的一个型号 , 那个电脑的特殊之处在于它的内存特别的大 , 然后显存也很大 ,但是没有很贵 ,在相对于 LG 的其他电脑而言 , 所以它就

天生的适合这些搞大模型的人买 。

Ronghui57:53

我觉得你说的营销那一点我特别同意 ,其实你看像梁文峰他不太接受 ,他不接受采访 ,不需要接受采访 ,但是他有他自己跟这个技术世界沟通的方式 。

庄明浩58:03

他做第一作者 。

Ronghui58:04

对 , 就是他们发的 ,而且我觉得他们发的 paper 就是也会其实会让你有一种对技术发展的一种乐观跟信心 , 就是在这个世界有各种各样的不可抗力因素导致的这个无法沟通的 , 或者是沟通不好的情况下, 还有一个世界是可以通过自己独特的一套语言 , 独特的一套方式来跟彼此沟通 。

我记得当时 DeepSeek 发了之后, 我看那个 Lex Fremon 的那个五个小时的播客嘛 , 我觉得他还是非常客观 , 跟平心静气的在分析为什么 R1 这么好 , 我觉得基本没有带什么政治视角带偏见 , 然后你还是会觉得原来这个技术世界的人还是很相信这一套 , 当你的产品做的足够好 , 我还是会从一个很客观的角度来评估跟认可你做的所有的事情 。

庄明浩58:52

是的 。

Koji 杨远骋58:52

对 , 我们刚才在讲开源生态啊 , 然后其实今年还有一个有意思的生态 , 就是今年国产有一个新的操作系统 , 这不是今年才有的 ,但今年他们成长非常快 。

庄明浩59:03

是的 。

Koji 杨远骋59:03

就华为的鸿蒙 。

庄明浩59:04

对 。

Koji 杨远骋59:04

然后我最近这个做了一期访谈 ,在小红书上面是一个短视频 , 就踩了一个这个鸿蒙的开发者 , 然后他是在重庆过着非常舒服的生活 ,他做的那个 APP 叫 Suki, 是一个情侣用的 APP,但他也有其他平台的版本啊 ,但鸿蒙上线的时间不长 ,但增长的非常快 。

我和他聊完之后就感觉也挺感慨的 , 就是一个新的生态出现的时候 ,其实会就是有红利的 , 早进场的开发者就能得到这个早期的流量的一些扶持和资源 。

庄明浩59:35

而且今年又是买电脑的事情 , 今年已经有鸿蒙系统的笔记本电脑了 。

Koji 杨远骋59:41

而且全应该汽车也有吧 。

庄明浩59:43

我觉得这是一个趋势 , 就是移动终端跟传统的这个我们叫 PC 终端的融合也是一个不可避免的趋势 , 所以你会发现今天这个时间点 , 我们已经可以买到 Totally 纯血的 , 我们叫纯血的鸿蒙的终端加鸿蒙的系统的笔记本电脑 ,因为很简单 , 对于移动生态而言 , 开发者生态就几乎等于很多很多很多的事情 , 然后我觉得不仅单纯针对我们叫独立

的偏独立的小开发者 , 可能对于已经非常成熟的这些开发者而言 , 鸿蒙生态的支持已经基本上是 OK 的了 , 我们常见的这些国民的应用早就已经 Totally 适配鸿蒙了 , 那对于这个生态而言 , 当一些基础需求被解决了之后, 那剩下变成个性化需求的时候 , 可能它就需要一个更就跟雨林一样 , 它需要一个非常复杂的生态 , 那这时候就需要越来越多的开发

者来进入到这个体系当中, 那它可能对于厂商而言 , 它做的工作跟努力就变成让又要让这个生态变得丰富多样化 。

Koji 杨远骋1:00:42

对 ,而且感觉在鸿蒙其实还是这个大家的付费的意愿能力都不错的 ,有一个开发者啊 ,他说单月 7 万块钱的收入 , 然后他做的应用就是比如说每日鸡尾酒 , 每日咖啡 , 什么日出日落时间 ,他大概做了 10 款 , 然后他背后用一套代码跨平台跨终端 , 所以速度是比较快的 , 然后两周到四周他就能上一款应用 , 这个收入对于这位开发者 ,

我不知道他在哪个城市啊 ,他不一定在北上广 ,但是这个这样的机会你如果在 iOS 在安卓是很困难的 。

庄明浩1:01:15

很难 。

Koji 杨远骋1:01:15

因为今天的这个 App Store 的这种关键词已经被封锁住了 , 就是前者已经把这个坑给占了 ,但今天鸿蒙还有很多坑现在在等着你 。

今年在应用层你有看到哪些值得注意的突破吗 , 我们前面聊了很多 Agent, 那除此之外觉得还有哪些是值得我们在年度复盘讲到年度科技记忆的时候 , 你会想到的一些关键词或者一些应用 。

庄明浩1:01:38

我觉得 Coding 肯定是回避不掉的嘛 , 就 AI Coding 这一年的进展确实 ,而且 Coding 在之前可能只是一个关键词 ,但你发现如果把这个拆开 , 前端后端数据库 , 然后是否有 IDE, 就是你再去拆关键词 , 然后你把这些拆出来的关键词的细的领域的进展 , 这一年也非常的多 , 我觉得 Coding 是一个 , 然后在别的可能这一年里面 , 我觉得一些垂直领域的 Agent 的发展也是蛮

快的 ,因为通用 Agent 变成了一种我觉得显学 , 就是无论是大的模型厂商还是那些最有名的初创公司 , 肯定都是通用那去走的 ,但是在垂直板块里面 , 比如像今年法律其实有几家公司融了很多钱 , 这个领域理论上来说你想就想明白它在干嘛 , 只不过它确实需要非常多的这个行业的垂直的信息 , 垂直的工作流 , 然后来去满足包括可能隐私数据安全

乱七八糟 , 然后可能不只有一家两家 , 它是可能五六家七八家公司都在这个板块拿到不错的融资跟不错的发展 , 然后这些板块可能有很多 , 法律可能是最多的 , 金融 , 然后金融又分一级二级保险银行乱七八糟 , 对吧 , 然后可能营销板块一直以来 , 你看我们当年做统计的时候营销都是最大的板块 , 营销这个类目也竞争的极度的卷 , 然后

又分线上营销线下营销 , 搜索引擎营销 , 视频营销 , 图片文字邮件乱七八糟 , 就是这个板块的公司虽然都没有特别特别的大 ,但是这个领域的公司其实发展也是我觉得是异常繁荣的 。

我觉得有一个板块是不在也不在主流的讨论范围内 ,但确实一直都在发展的 , 就是社交跟陪伴这个板块 ,H2Z 最新的搒单里面 Web 端有 10 家 , 前 50 有 10 家 ,APP 端有 12 家还是 13 家 , 就是但是没有什么人讨论 , 除了开源点 , 除了开源点没有人讨论 , 那可能是因为我因为我们做社交 , 我们会认为这件事情已经翻了可能三个代际了 , 就开源点是 1.0,2.0 是

加了一点点的互动跟沉浸式的体验 , 无论是图片的语音还是什么 ,3.0 变成一个偏场景化的打造了 , 然后甚至今天大家还在更往前尝试 , 所以你看其实在今年大概 Q3 开始 , 至少在国内一级市场 , 动态曼的几家公司融了很多钱 , 就做 AI 的动态曼 , 就是这是一个你一听就天花板非常想得清楚的一个板块 ,因为慢我们都不说动画了 , 慢这个板块

在上一代的移动互联网创业的年代 , 就已经大家吓唬住 , 结果没有任何的收获 , 那虽然 AI 给了这个事情更多的 buff 跟加成 ,但是顶到死顶到天花板它能顶成什么样也不会特别怎么样 ,但是它就是因为我们刚才叫挤压效应 , 就是图然后包括推理模型的这个这个演进 , 然后可控性的这个提升 , 再加上多万平台的内容的需求 , 然后再加上

出海的故事的叠加 , 再加上可能前面有短剧啊 ,有这些东西的加持 , 它让这个事情产生了一定的技术效应 , 然后就让这个板块本来不应该受到这样的关注的一个板块被挤出来了 , 就这就是一个非常典型的可能跟我们后面聊的资本市场有个一二级相关的 , 就是当我们刚才讲的前面这些所有的宏大叙事已经挤满人的时候 , 你要知道创业者也好

,VC 也好 , 投资人也好 ,也是需要附着 ,也是需要第二等级的牌桌的 , 一等级的牌桌容不下那么多人的 。

Koji 杨远骋1:04:59

所以你不看好 AI 动态曼这个 。

庄明浩1:05:02

我没有 , 我们也投了一家 , 我们有不看好 , 我们也有一家创业 , 我们投资的公司也有一家做这个 ,但确实它可能是一一就是它的周期不会特别长 , 就是它被市场关注并且认可的周期不会特别长 。

Koji 杨远骋1:05:14

所以要抓紧这些窗口 。

庄明浩1:05:15

对 , 当然当然 。

Ronghui1:05:17

那你觉得在国内到目前为止有出现类似 Cursor 的这种应用吗 ?

庄明浩1:05:23

Cursor 就是或者说就是类似 Cursor 可能有两个解读 , 第一个是 Coding 嘛 ,Coding 可能大家都有 ,但是另外一个解读就是这个影响力跟这个定义了一个范式或者一个品类 , 我觉得挺难的 , 挺难的 。

Ronghui1:05:33

为什么呀 , 难点是什么 ?

庄明浩1:05:34

我觉得还是跟就是怎么讲 , 就是大家原来会说中国的移动互联网的纯 2C 的产品的 , 比如设计能力运营这些东西可能比美国更成熟 , 所以大家会期待纯 2C 应用端的爆发在国内的这个可能性 , 可是截止到今天这个时间我们并没有看到这个这个结论 , 就或者这个结论被验证成为现实的东西 , 你看看拉搒单还是我们刚才聊的这些东西 , 至少

在搒单 , 然后搒单上出现一些意外的名字的时候 , 然后你真的细看那个 APP, 它可能 90% 是一个传统 APP, 可能加了 10% 的 AI 功能 , 然后它就被画在了一个搒单上, 你就会觉得这种东西你并不认可它是一个那么新的东西 , 它可能确实加了 AI 的功能 ,但是它被画到一个类似 AI 什么应用搒单的前面这个位置 , 你就觉得它都多少年了 , 公司还在这 。

Koji 杨远骋1:06:25

对 。

庄明浩1:06:25

这就不好说了 。

Ronghui1:06:28

因为你看美国那些应用就是动不动标题全部都是多少多少时间之内达到多少多少 AR。

庄明浩1:06:34

对 , 这可能是美国的趋势 , 就是说中国没有办法讲这个趋势 ,因为我们没有办法讲 AR, 那然后这个问题变成了我们能评判什么 , 能评判无非就是用户量 , 那用户量在这个时间点在当下的中国的移动互联网 , 哪怕把 Web 算上的情况下, 很难 , 太难了 , 就这个不是 AI 的问题啊 , 它是整个行业 , 就把移动网所有的 APP 都加在一起 , 它都面临这个问题 , 所

以你看那个上半年那个 Quest Mobile 不是统计吗 , 它统计三类的这个 , 它把所有的 AI 的应用泛泛的 AI 应用分成三类 , 第一种叫独立的 APP, 第二种叫 Web, 第三种叫插件 , 独立的 APP 跟 Web 里面 43% 的都是用户量出现负增长的 , 然后就只有 1/4 的独立的 APP 跟 Web 的 AI 的应用是增长的 , 然后反过来讲插件里面可能 2/3 是在增长的 , 可是问题在于谁甘心做个插件呢 ,

对吧 , 就这个这个就是现实嘛 , 那插件为什么会这样 ,也是因为今天这个时间点可能在中国的现有的这个 , 我们还是以古典的这套移动互联网叙事情况下, 入口位置全都已经被占满了 , 就跟关键词一样 , 你不做个插件 , 你单纯想 P 出来也变战场太难了 , 好还是回到我们前面的那些 , 我们就只说比如说那个那几家做 AI 图片社区的公司

, 那个什么宇宙 , 就是月文孵化那家公司 , 然后修韩捏他离谱 , 可能还有三四家吧 ,其实他们第一都拿到钱了 ,而且可能都拿了两三轮三四轮的钱了 , 然后你说创始人不优秀吗 ,其实都很优秀 , 然后也在做正确的双引号正确的事情 , 可是你不太会期待他突然间比如几个月用户数据涨个 0, 这不可能 , 就是物理条件上都不可能 , 那肯定那变成

原来那个我们移动互联网非常熟悉那个超级爆的那个叙事已经不太可能再今天出现了 , 就是你想当年你像我当年记得第一个爆唱吧 , 一周可能就 100 万日活就出现了 , 那然后类似这样的故事就几乎频繁的出现在中国移动互联网爆发那几年, 可是今天不太可能 ,而且哪怕出现了它也会像流星一样 。

资本视角1:08:36

Koji 杨远骋1:08:36

我觉得在美国现在有非常多夸张的融资故事 , 基本上以周围为度在发生 , 就是一个没听说过的公司出来融了比如说 5,000 万美金 , 对吧 , 我觉得我刚才说这个故事可能每周一定有一个 ,但这些公司很多是 ToB 的 ,但在中国感觉这里不太可能发生 , 一方面是因为这个中国的中小企业的这种付费意愿 , 付费能力和整体的付费意识 , 然后另一方面是我觉得我们就是

移动互联网太成熟 ,但移动互联网其实是一个充满了城堡的地方 , 微信是一个城堡 , 抖音是一个城堡 , 小红书是一个城堡 ,但是在美国这是一个更开放一点的 Web 端的开放的 , 就是很欢迎大家去用各种工具来一起 1+1 大于 2 的一个地方 , 所以我觉得其实这个我不知道这个最后会指向什么样的一个两边的发展 ,但只能说今天这个差异是非常大的 ,而且这个差异折

射到创业的这个生态或者创业的机会的选择 , 确实我觉得我们现在是更加被动的 。

庄明浩1:09:39

就是原来那套我们太过熟悉的叙事在今天确实太难了 , 太难 , 那我们可能需要一些新的叙事 , 那这新的叙事又不能是完全 copy 美国的那套东西 ,因为我们的底层的这个基础就不具备 , 那我们的叙事应该是什么样 , 这可能也是今天这个时间点 , 我觉得不仅仅是创业者的问题 , 可能也是投资人的问题 , 就我们去投什么 , 就是你很现实的问题在

于对于今天的尤其是偏美元的 VC 而言 ,在 AI 领域投资其实真的非常难做 , 非常非常难做 , 就是你你大模型出来的时候投一个大模型 , 然后跟几轮 , 然后你这个事情就结束了 , 你只能等 , 对吧 , 你只能等 , 然后呢大家都说 AI 应用看中国公司 , 可是你要么出海团队 , 可是出海团队就会出现别的乱七八糟的问题 , 那你投纯国内团队 ,

那你期待的到底是什么 , 就是你期待的可能性 , 我说的直白一点 , 你期待退出是什么 , 对吧 , 就是这些问题无解 , 当然这些问题因为我今天不干纯 VC 了 , 我可以站着说话不要讲这些问题 ,但是你你你这问题你一想你这活都没法干啊 , 你只能抛弃掉这些 , 你先不要想这些问题 , 先看这些创始人什么背景在做什么 , 去跟他认真的

聊 , 然后再去选择是否相信这件事情 , 然后把这些无解的问题暂时的搁置 , 或者说不要想那么多 ,因为你想也想不清楚 。

Koji 杨远骋1:10:55

我那天我那天见一个基金的合伙人啊 , 管理合伙人, 然后我就问他怎么看在现在这个情况之下美元 VC, 就是大家觉得都挺不好做的 , 然后他就说他问了自己一个问题 , 就是还相不相信就是整个 VC 的底层叙事 , 就是科技公司需要靠一些耐心资本在早期去帮助他们实现从 0 到 1 的建设 , 如果还相信 。

庄明浩1:11:24

就应该干 。

Koji 杨远骋1:11:25

就应该干 。

庄明浩1:11:25

就跟今年就就就正好昨天诺贝尔奖今年的金曲奖颁给的三位有有一位研究的就是他讲的就是就是我们叫创新式的或者说叫破坏式的技术创新 , 才能带来真正意义上的经济的高速增长 , 那破坏式的这种技术创新它跟 VC 的叙事是绑在一起的 , 那就如果你相信这个最底层你当然还是需要 , 可是问题在于这是一个太过太过理想化跟太过终

极的答案 , 就是它就是这个问题跟这个答案跟这个逻辑本身没有就是任何人说都可以都没有错 ,但是它落回到现实的执行层 , 尤其在国内它会有太多的掣肘 , 它会有太多的限制条件 , 它你只能在这种有限的可被你辗转腾挪的空间内找寻那个那个解 , 就这个是我觉得今天这个时间点 , 尤其是偏我们相信技术 , 相信产品 , 相信这些东

西会改变很多事情的这些投资人 ,他内心要去不断来回来纠结的这个这个这个天平 。

Koji 杨远骋1:12:26

那你觉得在 AI 这个主题之外, 比如说今年同样这个热门的巨声 , 就是这个有更多钱进去 , 对吧 , 然后 。

Ronghui1:12:33

AI 硬件其实很热 。

庄明浩1:12:35

对 ,AI 硬件很热 。 我们看拿钱的创始人的背景的变化 , 先是比如说什么字节的什么那几个大厂的产品经理出来拿了一波钱 , 然后大家发现这样不行 , 就是当然可能之前还有一波做科研的什么什么什么实验室的什么老师或者什么学员 , 然后发现这两拨人可能不太行 ,也不是说不太行吧 , 就是突然之后发现杆差 , 就是还是想再看看别

的 , 然后你就你就会再往行业里走 ,他会走到哪 , 比如走到大疆的创始人, 大疆的什么追觅的什么莱芬的这帮什么石头的什么那个影石的 , 对吧 , 就是你会觉得 。

Koji 杨远骋1:13:10

还有一个媒体标题 FA 已经把办公室看成大象 。

庄明浩1:13:13

就是它逻辑你想就想得很清楚 , 就是我已经把我能力原来能力就是我最熟悉能力范围圈的人投完了 , 然后为什么要投 AI 应用 ,因为纯软大家不相信嘛 , 或者说大家会担心嘛 , 就刚才我们讲那些问题 , 那有应了之后理论上说确实它可见嘛 , 它你们见得着摸得着 , 它可能有产生直接的收入 , 对吧 , 它反正它有些理由 , 对吧 。

Koji 杨远骋1:13:34

而且有中国的得天独厚的优势 。

庄明浩1:13:36

供应链大而这那 , 然后也投完然后他发现还是不太行 , 那就再往前走 , 我去找那些能给我内心的信任程度跟这个我能睡得着这个程度加分的背景的创始人, 就是这个逻辑是一个你讲就讲得明白的逻辑 ,但反过来讲就是说我还是观点就是我们是站着说话不腰疼啊 , 就是我们是可以以一个旁观者的方式去总结这个规律的 ,但是如果今天你

是一个站在战场里的人, 你是不能以这种方式干活的 , 就是那你就没法干了 。

Ronghui1:14:07

对 , 我昨天看那个 Uncapped 那个播客 ,Jack Osmond 采访那个 Vince Hanker, 就是他是 Thrive Capital 的 partner,他讲了一个故事 , 我都觉得这根本就在中国就不可能了 ,他说他们投他投了一个公司 , 花了 18 个月研究这个公司 , 我看的时候我就跟 。

庄明浩1:14:26

中国 18 个月已经过了四个周期 。

Koji 杨远骋1:14:27

Vince 前段时间两个月前来了中国的 , 我们刚才提到的好几个公司他都见了 ,他一个很行程非常密集的 Business trip, 所以其实我觉得深在其中, 我自己还是相对乐观的 。

庄明浩1:14:38

当然这个这个这个观点也特别哲学 , 就物极必反 , 就是极端到一定程度一定会有别的什么样 , 就跟刚才我们讲的观点一样 , 我们已经莫莫须有的走到了一个什么极端的状态里面 , 你会发现回头发现其实它有别的解 , 我举个很现实的例子 , 游戏投资已经早就不属于 VC 的战场了 , 就就是中国的游戏投资在 15 年之后基本上就不属于 VC 了

,但是在最近两年时间里面 ,有海外的 VC 来看中国的公司 ,是海外的 VC 啊 , 都不是中国的 VC,是海外的 VC 来看中国的早期游戏团队 , 你要知道中国的早期游戏团队已经不在 VC 的社群里面快 10 年了 , 就是它有太多的条件 。

Koji 杨远骋1:15:18

那这些海外的 VC 他们的逻辑是什么 ,他们认为退出的可能在哪里呢 ?

庄明浩1:15:22

他们不是先不是考虑退出 ,他们先考虑是成本的问题 , 相对于海外的游戏团队而言 , 中国的游戏团队太便宜了 , 这种便宜是全方位的便宜 ,而且海外的游戏的并购是异常活跃的一直都非常活跃 , 那它就相当于把两边的优势拉在一起来做 , 中国的 VC 做不了 。

Koji 杨远骋1:15:39

所以说其实我觉得像刚才说 Vince 来中国 , 包括海外 VC 看中国的游戏 , 我觉得这个世界仍然是非常关注中国 , 我们刚才聊了很多一级啊 , 然后最近二级可能是得到大家注意力或者新闻头版头条更多的地方 , 然后 OpenAI 和 AMD 的那个新闻一发 ,AMD 如此庞大一个公司涨了 40%, 然后就在我们录播客的前一天 ,OpenAI 和这个博通 Broadcom, 然后这个新闻一发直接拉动人家 10%, 所以在

二级市场其实发生了很多的故事 , 财富的这个充满了乐观的一个情绪 , 对 , 所以想听听明浩 , 你最近一年我知道你和很多二级的分析师 , 这个投资经理的关系 , 这个互相的这个沟通也很频繁 , 对 , 你会怎么来去回顾这一年 ?

庄明浩1:16:31

我很想还是观点 , 就是既然是司马先 , 我们就按自己做的文件来看 , 我很我觉得很有意思 , 我今年一共做了截止到今天一共应该是做了 6 个还是 7 个 , 我马上做的是第七个 , 之前做了 6 个 , 去年的年终总结 ,DeepSeek、Manus、Agent, 然后年终总结就 Q2 的总结 , 然后上一个就是 9 月份的 Q3 的总结 ,但是我做完 9 月份 Q3 应该是我刚讲 9 月 4 号就做完了 ,

我现在要做第七个嘛 , 前 6 个 PPT 里面我是在大概第四个 PPT 的时候才有一页讲是不是泡沫 , 第五页第五个版本里面已经有大概两页讲是不是泡沫 , 我上一个 9 月份那个版本里面大概有 6 页讲是不是泡沫 , 很简单 , 马上我新发的这里面会有一章来讲是不是泡沫 , 那这个数字跟这个月份的变化 , 你就知道这个问题讨论的程度开始出

现了变化 , 就是我可能在 Q2 的时候有一些声音会认为这些东西有一些不太对 ,有一些探讨 , 然后 Q3 的时候其实有一些 , 你像我 Q3 的时候用引用最多的是硅谷银行的的报告 , 它其实是做了很多定性跟定量的分析 , 那这些分析方式其实今天现在来看很多新闻都在做 , 比如我们跟 20 年的互联网泡沫的曲线的归对比 , 就那个时候硅谷银行已经

在做了 , 然后今天在这个时间点再去讨论的时候 , 确实这一波的时候我还是那个观点啊 , 我们真的不知不觉走到了极限里面 , 这个极限是什么呢 , 你想嘛 , 最头部那个七姐妹的最头部几家的市值已经是三四万亿美金了 ,他们每年的可操作的经营现金流是千亿美金这个量级 , 对吧 , 然后呢 OpenAI 的估值是 5,000 亿美金 , 就这几个数字

摆在这 , 它可以做的事情就太多了 , 然后大家发现我不单纯只需要 , 或者说我单纯只靠散户买股票的上涨这件事情已经这个游戏已经不够 happy 了 ,不够刺激了 , 然后又因为 OpenAI 走到了一个节点是说 , 我觉得 Sam 可能 Sam 某个时间点顿悟了 ,他顿悟的是什么呢 ,他原来 OpenAI 在资本城的操作是说融资卖老股拉估值 , 然后同时我也用自己的融到的钱或者我的

股份去投资初创公司 , 或者买你像今天他买了那个苹果设计师公司 , 这个故事还是在一个可控跟可被线性归纳的范围内的 , 虽然我的估值可能每 6 个月和 9 个月翻一翻 , 我可能一轮估值一轮融资融一两百亿美金三四百亿美金已经是历史记录了 , 已经是历史记录了 ,但是它还在一个可控范围内 , 至少有人买单成交的当下合同是签好的 , 对吧 , 所有

人是认可这件事情 ,但我觉得他可能在某些点意识到是说 , 我觉得这个这个另外一个最近用的很多比喻叫踢云纵 , 就是 Google 有云有模型有产品有 infrastructure, 那如果未来 AI 真的所有的事情的话 ,Google3 万亿美金 OpenAI 应该值多少 , 然后呢我未来的增长预期是建立在我巨大的投入基础上, 那这个预期我打多久 , 原来可能是打半年一年, 那这个预期我能不能打 5 年,

所以你会发现最近段时间的这些合同全部都是 5 年 10 年期的合同 , 可是这太讽刺了 , 我们刚才讲过技术的进展是按月进的 , 对吧 , 你想想我们看过的所有的高质量低质量的券商的分析师的银行的行业分析的技术分析的报告 , 没有人写 5 年的报告 , 可是我们今天的预期 ,Sam 说我妈就要把未来 5 年的预期全部压在这件事情上, 我既

然已经 5,000 亿美金的公司了 , 你要知道 5,000 亿美金哪怕是一个衣裳的估值 , 我们把 5,000 亿美金的这个价格绑在市值的这个估值上, 比它高的没有多少公司了 , 比它高的没有几家公司了 , 那它就可以做 , 哪怕今天 OpenAI 没有上市 ,不需要那个上市的地位 , 我也可以做所有的事情 , 所以有了我们今天最近一个月时间看到的所有的事情 , 当年 Sam 在 24 年的时候说过这件事

情做成是要 7 万亿美金的 , 这个数字是被说过的 ,7 万亿美金如果大家有印象可以去搜新闻 , 当时所有人看到这新闻觉得 Sam 疯了 , 那时候 OpenAI 才 1,800 万美金 ,1,800 亿美金嘛 ,7 万亿美金 , 就这个数字本身的量级已经超过了所有人的脑脑容量 , 没有人知道 7 万亿美金代表着什么 ,但是今天你真的把未来 5 年的预期 ,OpenAI 的预期 ,NVIDIA 的预期 , 微软的预期 ,Google 的

预期 ,Oracle 的预期加不加吧 , 已经是可以碰到万亿美金这个量级了 ,是不是 7 万亿我们不知道 ,但至少万亿美金这个数量级被讨论了 , 然后那这个故事就全部压在相当于我把我未来 5 年的预期打满 , 我要做的所有事情也在今天全部打满 , 我打到谁身上, 谁就把他的未来 5 年预期也打满 , 然后又因为市场竞争竞争格局乱七八糟 , 这些初创上

市公司哪怕是世界上最最最估值高的上市公司 ,也需要一个这样一个巨大叙事下的所有的事情 ,因为所有人都不可能落下, 没有任何人担得起责任是说我不参与 , 好吧 , 所有人拿上来之后, 就像大家原来认为 AI 是一个是一个技术是个产业 , 今天 AI 就是市场本身 , 所以它变成了就是我不单纯是家公司 , 我甚至都不单纯是个行业 , 我是系统本身 , 就是 too big to fail 已经

太容易去解释这件事情了 , 它已经不单纯是 big 的问题了 , 它的生态变成异常的复杂 , 它把所有人都拉上车 , 然后大到这个数字撑到你去所有的理性评判已经没法评判 , 我在今天播客不断去强调 , 我们走到了一个我们都所有人没有意识到的那个极限里了 , 这个极限是什么 , 你要知道截止到今天 , 世界上所有的上市公司在上市那一天融的钱最

多 262 亿美金 , 谁啊 ?

Ronghui1:22:23

你指单个公司 ?

庄明浩1:22:24

单个公司 , 沙特的那个石油公司 , 什么沙特阿美 , 那是世界纪录 ,226 亿美金已经比 OpenAI 甚至比 Claude 的单个融资小了 , 那 OpenAI 如果今天上市它多大 , 它要融多少钱 , 这个故事挺破的 , 然后再想 , 那天看一个数据是说 Web 年代烧钱最多的上市公司上市的时候 , 亚马逊大概烧了 20 亿美金就上市了 , 移动互联网年代 Uber 烧了最多的钱 , 烧了大概 400 亿美金也上

市了 ,20 倍 , 那是不是 OpenAI 也要烧到 400 亿美金的 20 倍才到上市 ,也就是它要烧 8,000 亿美金才上市 , 现在看上去这个数字不是什么天方夜谭 , 它很有可能就是事实 , 那就是它被定在了这个位置上, 然后我们无论什么样的原因 , 这个事业这个行业走到了这个时间点 , 带着美国巨大的技术硅谷叙事以及金融叙事走到了这 , 这个故事只能这么走下去 , 没有

什么别的办法 , 然后这是刚才我们讲所有 , 然后再讲今天无数的人再去评判这件事情跟当年的互联网的泡沫 , 甚至跟当年的铁路去比 , 然后当然已经没有人去跟一金箱跟比特币去比了 ,因为大家发现那不是一件事情了 , 对吧 , 我们不要讨论那些事情 , 我们讨论这些真正意义上的工业革命跟历史革命带来的这些事情 , 大家会说所以最近一段

时间讨论什么比较多呢 , 讨论说我们跟互联网行业相比的时候 , 确实互联网行业当年看到的表象是说所有的上市的纳斯达克的 .com 股份爆了 ,但是实际上底层的基础设施的光纤为我们提供了后来所有互联网的基础 , 可是现实的问题在于那些当年不涉光纤的公司全部死掉了 , 那是不是今天所有这些数据中心公司可能也会死掉 , 然后呢未来会带

来一个美好的未来 , 然后这里面出现了一个 bug 是说光纤铺在那 15 年 20 年之后还是可以用的 , 对吧 , 就今天数据中心放在那卡三个都不用三年, 两年之后那个卡就没法用了 , 或者就过时了就要折旧了 , 那这个卡的折旧周期到底是多少 , 变成巨大的 , 然后再一个讨论 , 比如说大家会说巨大的 CapEx 投入是建立在头部公司超强的营收能力上的 , 就这

几家 Meta、Google、NVIDIA, 这个微软都是每年自己可以赚个 1,000 亿美金的 , 所以我投 1,000 亿美金没问题 ,但是除了这几家之外的这个体系内其他这些公司 ,Coway 这几家做银的公司 , 甚至马斯克的 XAI,他们的现在需要新的钱已经开始用债务了 , 所以很多人去分析泡沫的时候说股带来的泡沫其实没有那么麻烦 ,但债带来的泡沫就很麻烦 , 资金带危机 ,因为债是硬性的 , 所以你会发

现我们把那几家最大的拿掉之外, 底下的风险系数已经非常高了 ,Coway 这种公司资产代表已经没法看了 ,但人说我他妈原来是做矿场的 , 古典金融这点杠杆 , 对吧 , 对于我们这些 Web3 的公司而言 , 好像也没什么大不了的 , 对吧 , 所以这是一个叙事 , 然后再一个更有意思的叙事 , 比如说我们回看今天截止到 2025 年 10 月中, 标普 500 所有的公司涨的最好的两

家公司 ,不是 Planetary,不是记忆通用电气能源 , 甚至不是金矿公司 ,是两家做硬盘的公司 , 希捷跟西部数据 , 为什么 ,因为大家发现数据中心的建设狂潮 , 大家炒完了第一波最直接受益的英伟达 , 炒完了云公司 , 连 VRT 跟冷却都炒完了 , 电力也炒完了 , 发现需要硬盘 , 需要存储 , 然后硬盘又受到固态颗粒的限制 , 所以为什么 Sam Altman 最近去了韩国跟日本找了 SK

跟三星 ,因为他要保证存储颗粒的提供 , 就是我又又回到刚才我们说那句话 , 我们真的不知不觉走到了很多事情的极限 , 就是电力冷却这些已经讲无数 ,但是你发现连存储都出了限制 ,而且这个东西这个行业绝对垄断 , 所以你发现所有事情全部打包在一起之后, 你说是谁的原因 , 或者是一家公司两个 ,不是 , 它就是一场巨大的共谋 ,但共谋不是

非非主动的 , 它就滚到这了 , 没有办法了 ,而当我们意识到的时候 , 回头看已经没有没有退路了 , 我们只能继续往前走了 , 就是它就是一个这样的故事 。

Koji 杨远骋1:26:48

咱们前面其实说了很多 , 都是欧美在 2025 年硬件算力方面的进展 , 就其实我们也看到国内这几年在这些方面也有很多相应的大的投入跟成果 , 我想这个行业里面应该所有人都记得今年这个夏天世界人工智能大会和机器人大会的这个火爆 , 一票难求 , 我补充一个 , 就是在搜资料的时候看到的一个细节 , 就是我让 AI 再给我总结 , 就是在算力这方面的一些资料

算力与机器人1:26:48

Koji 杨远骋1:27:19

的时候 , 几个 chatbot 都列出了一点 , 就是国内的东数西算工程在 2025 年实现了建成一个超过 300 亿 flops 的智能算力网络 , 这个东数西算工程就是一个从 2022 年启动的一个国家级的项目 , 它核心的想法是把东部产生的数据处理需求转移到西部去来做一个优化资源配置 , 那 300 亿 flops 的意思就是用最简单的话来说是 , 这个也是 AI 给我解释的哈 , 就是如果你的

手机每秒能够做 100 个计算 , 那么 300 亿 flops 就等于是 300 万亿台你的手机同时工作一秒钟 , 那具体到对应到应用层的影响 , 那这个能力指的就是它可以支撑超大规模的 AI 模型处理海量的城市的数据和数十亿人同时使用的这个互联网服务 , 那另外一方面可能大家就是也都特别的关注和有很多成果的领域呢 ,不用说就是大家都知道就是机器人, 大

家都说的具身智能 , 这里面有很多有名的厂商我们就不用说了 , 这个中国在过去的 12 年里面一直都是全球最大的工业机器人的市场 , 我没有记错的话呢 ,9 月份有一份叫做世界机器人报告 , 里面除了提到说中国的工业机器人在新安装量和运营运营存量上都是第一名 , 这个指的是 2024 年的一个总结哈 , 那 2025 年它肯定是它它它可能可能是一个更高或者是一

个对标的一个状态 , 那里面还有提到了一个关键词 , 就是在 2024 年的时候 , 本土制造商在中国的销量就已第一次超过了外国供应商 , 本土供应商的市场份额从 10 年前的 28% 提高到了 57%,也就是翻了两倍 , 我们之前有一期节目就是录的时候 , 那个嘉宾他就在参加机器人大会 , 然后录的时候我记得他跟我们说他那天晚上就要去参加机器人运动会 ,他就说了一些自己

很具象的观察 , 我也印象特别深 ,他说就是像就比如说像汽车文化里面有 F1, 那机器人运动会其实它也是带着一种就是建立一个文化土壤的这个含义在存在 , 可能对未来这个产业发展 , 未来这个产业的发展会有很深刻的影响 ,他也做一个类比 , 就比如说他在机器人大会的现场看到的很多小孩和机器人互动 , 让他就是感受到就是可能比如说我们都是

跟着电脑或者手机长大的人, 那现在的小孩他有可能就是伴随着 ,不是有可能就是哈 ,他就是伴随着机器人长大的一代人, 所以就站在一个更远的时间点来看今天 ,其实也是我们前面问明浩的 , 就是什么事情是 10 年后想起来仍然对今年会很有印象的 , 就会觉得其实现在真的是站在一个一个一个新时代的一个开端的一个感觉 。

庄明浩1:30:29

我觉得挺有意思的 , 我们从一开始这个讲大模型 , 讲多模态 , 讲 Agent, 然后到后面讲二级市场 , 这个就一开始可能我们聊的是创业 , 聊的是机会 , 聊的是技术产品 , 然后聊到最后其实是非常这个有历史的这种 。

Koji 杨远骋1:30:45

长河我是司马迁呀 , 慢慢走 ,有这种非常宏观的 , 好像我站在这个黄河的悬崖峭壁上看这个大好河山 , 或者这个你不知道这个河山是要下雨了还是要万丈晴空了 , 对 ,anyway 我觉得很有意思的一期内容 ,也谢谢明浩 , 感谢感谢 , 然后也期待明年这个时候我们再来复盘 , 好 ,OK, 好 , 谢谢 , 感谢感谢 。

如果你认为有朋友也会喜欢本期十字路口的内容 , 请转发微信推荐给他们 , 最后欢迎你加入十字路口的会员群 , 我们鼓励大家在群里聊天互动交朋友 , 寻找未来的同路人。