开场0:00
欢迎收听 《 十字路口 》, 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会 。 十字路口是乔布斯对苹果公司的一个比喻 , 形容它站在 " 科技与人文的十字路口 ", 伟大的产品往往诞生在这里 。AI 正在给各行各业带来改变 , 我们寻找 、 访谈和凝聚 AI 时代的 " 积极行动者 ", 和他们一起探索和拥抱新变化 、 新的可能性 。
我是主播 Koji 杨元成 , 联合创办了 《 街旁 》《 新世相 》 和 《 躺倒 》。 我相信科技 , 尤其是 AI, 会在未来 10 年彻底改变社会 , 赋能人类 。
欢迎大家找我聊天 , 碰撞想法 , 链接下一个可能性 。
我是主播 Ronghui, 目前在一家专注科技投资的风险投资机构工作 , 之前在 《 第一财经周刊 》 担任驻硅谷记者 。
在本周的 《 十字路口 》, 我们非常开心和 《 晚点 》 的播客 《 晚点聊 》 串台 。 那本周呢 , 我们将继续盘点 2024 年的 AI 行业 , 我们将重点聊一聊大模型 。
本周我们也邀请到了 《 晚点 》 的副主编 、 科技组的负责人程曼祺 。《 晚点 》 上周发布了一篇引发了广泛讨论的文章 , 文章的标题是 《 中国大模型生存战 : 巨头围剿 , 创业难熬 》。
这篇文章的篇幅不长 ,但非常犀利 , 将业内零散的观点和情绪进行了系统的整理 , 形成了一个完整的叙事框架 , 为当前中国大模型行业的现状提供了一个重要的共识角度 : 这不再是六小龙的竞争 ,而是巨头与创业公司之间的激战 。
气势如虹的字节就像灭霸一样 , 似乎有着摧毁一切创业梦想的力量 。 而阿里呢 , 则出手阔绰 , 投资毫不吝啬 , 正在打一场 " 代理人战争 ", 无论这场战争的结果如何 , 阿里应该都能通过阿里云来收获这场战争的成果 。
那这几天我看到这篇文章获得了大量的转发和讨论 , 特别是文章当中用 " 大象会跳舞 " 来比喻字节跳动 。
我想甚至很可能在未来的几年的中国科技行业 ,在大家讨论的语境当中, 每当我们提到大象 , 都很可能会心照不宣地知道这指的是字节 ,因为大象会跳舞 , 字节在跳动 。
那我们在开始的时候 , 先请曼祺再来给还没看过这篇文章的朋友们再介绍一下, 这篇文章大概讲了什么内容 。
好 ,《 十字路口 》 的各位听友大家好 。 因为之前我自己做播客 , 我可能更多是提问题的角色 , 那今天就是我可能会输出得多一点 , 然后讲得有不对的地方 , 我觉得大家可以在评论区多补充 , 这样我们也能形成一个更完整的讨论 。
技术进化2:28
我觉得刚才 Koji 讲的这个事挺好玩的 ,因为字节的英文名词就是叫这个 "Bat Dance" 嘛 ,其实就是有跳舞的意思 。
然后大象在跳舞这个比喻也是来自文中就是有提到是一位投资人 ,他有一个总结 ,也非常感谢他的这个观察 。其实这个文章的主题就是标题里说的 , 就是 " 创业煎熬巨头围剿 "。
我自己也在想 , 我们操作完这个东西之后, 一个核心的 takeaway 是什么 ? 那我们能看到的一个核心的变化就是 , 从去年到今年, 其实在很快的一个时间里面 , 可以看到就是创业公司它之前所说的 " 我有一个灵活的组织 , 然后我有一个技术含量更高团队 " 的这个优势 , 好像在字节的猛力追赶面前就变得没有那么明显了 。
然后字节的这个起来的速度是非常快的 。 那这个事其实它根源还是在于你说这个技术的进化 , 它的速度和方向到底是怎样的 , 它未来的提升有多快 。
我觉得现在市场对于大模型创业的分歧也非常大 , 还是有一部分人是看好和相信的 , 然后有另一部分人可能从之前非常看好变成了比较悲观 。
那这个分歧的根源其实也在于说技术的进化有多快 。 然后我们如果从这个框架去看它未来可能的变化的话 , 我觉得这是一个大的框架 , 我们之后聊的时候可以展开 。
如果说你的技术进化得更快的话 , 那首先我觉得有一个事就是 , 你前瞻的技术判断是很重要的 , 那也许创业公司就有优势 , 对吧 ?
因为有的时候其实可能有一些真理它就是掌握在少数人手中的 。 那有一些创业公司也许它有一个关键的人物存在 , 就导致它可能能更早一步看到一些技术上的变化 。
哪怕中国的公司不是说在全球能第一个做出什么 , 如果你能更快地跟随 , 它也是一种优势 。 应该是昨天 The Information 有一篇报道 , 它就是在讲字节的大模型 , 就是说字节其实自己内部训练大模型也有遇到一些不顺利的地方 , 然后字节还搞了一个团队去新加坡去调查 , 就他们为什么在数学和推理能力上有一些进展并没有那么顺利 。
那另一方面我们可以看到像越战面还有 DeepSeek 这种更小的团队 , 目前看起来好像在推理的能力的提升上, 它的进展是更快的 。
之前 OpenAI 9 月发了 o1 这个方向之后, 那现在是 11 月 , 对吧 ? 其实比较短的时间里面 , 前后脚越战面就发了它的这个数学模型 Kimi Maths, 然后 DeepSeek 发了这个 RELight, 它们都是强调我在数学和推理上是有一个更好的能力的 。
包括我们自己发 《 大模型生存之战 》 这篇稿件的同一天 , 我们当天也发了一个小独家 , 写的就是华为洛亚方舟之前的有一个人加入了越战面 ,他就是要去做这个 o1 方向的探索 ,而且字节其实也挖了这个人 ,但这个人他是选择了去创业公司的 。
包括我们之前也得到一个信息 , 大概今年初的时候吧 , 杨植麟在内部开会 ,他其实当时有讲到就说今年越战面可能有一个技术目标就是要实现多阶段推理 。
当然我没有更多的信息 , 我不知道就是杨植麟当时说的这个多阶段推理 , 它是不是就是现在 o1 的这个方向 ,但是你只看这个字面意思的话是有点相似的 。
因为其实 o1 它就是通过思维链的这种方式 , 它是会更像人类那样去一步一步地去做一些思考 , 然后可能能给你一个更完整的或者更深度的结果 , 对吧 ?
那有可能他是不是更早地看到了这个东西 , 我也不知道 。
刚才曼祺提到 , 如果说这个技术的进化仍然非常快的话 , 那创业公司可能就更加有优势 ,因为靠少部分的这个天才型的选手 , 很可能就能够迅速做出突破 , 拉开差距 。
然后其实在这个发了 o1 之后, 我有注意到国内有个团队 , 就大家也都知道 Monica,其实他们发了一个自己的一个技术叫做 Standard Preview, 那它也是他们团队这个有一位小天才姬一超 , 应该如果大家了解她的话 , 知道她是上一代猛犸浏览器 , 她还在读高中的时候就做了这么一个这个在整个全球市场都很有影响力的一个产品 。
那这个 Standard Preview 也是姬一超的作品 , 所以现在 Monica 里面也可以用到这样一个推理模型 , 这是他们自己 in-house 提供的一种能力 。
这个确实是我看到的时候很 surprise, 就是这样的突破如果仍然在不断地发生的话 , 那小团队 、 小公司确实有可能能抓到一些这样的机会 。
对 , 我觉得你这个补充挺好 。 姬一超确实 , 她当年也是个小天才 , 她应该做那个猛犸浏览器的时候才 17 岁吧 , 她很早就开始创业 。
然后我们回到就刚才说就是如果技术进化更快 , 我觉得这是第一件事 , 对吧 ? 就可能创业公司它有一些判断上的优势 。
第二件事就是我觉得也会让模应一体 , 就是模型和应用一起做 , 或者说叫模型级应用 , 这个事是去年到今年其实很多大模型的公司都会讲 , 会让这个事变得更有道理 。
因为你模型能力进化得更快 , 你可能就说它在产品体验上的反应也会更快 。 如果你自己是同时掌握这两个东西的话 , 就理论上可能你去系统协调优化它的这个速度也会更快 。
我觉得这是如果进化更快它带来的可能的结果 。 那如果它的发展是另一个方向 , 就是说这个模型的能力是放缓的 , 那我觉得首先可能就是在体验上, 大家只是靠模型本身的能力带来的体验差异就会不明显 。
我觉得这确实是现在至少我觉得作为一个用户你可能比较直观地会感受到这种情况 , 对吧 ? 比如说豆包和 Kimi, 包括像通义 , 就是你说它用起来是不是谁比谁好特别多 , 好像没有那么明显 。
那这种情况下的话 , 你可能你要把这个产品做好就变得更重要了 。 而这件事又是一个组合拳 , 它可能有些东西就是大厂的优势 , 比如说你之前就积累了做产品的一个生产链条基础设施 , 包括最重要的就是你有流量有渠道 。
这个我们文章里也提到了 ,其实字节它投流的效率可能是比大部分创业公司都更高的 。 包括抖音今年 4 月开始 , 它也不再接受就是字节之外的其他的 AI 产品在它这儿来投放 。
然后如果进化更缓慢的话 , 刚才说是第一个嘛 , 我觉得第二个还有一个压力就是说我们最关注的这些估值最高 、 融资最多的大模型公司 , 它们可能还会有一些竞争 , 就是来自那些更轻的公司 , 就我只做应用 , 对吧 ?
我可能背后就是调用的某一个全球最好的模型的 API, 或者我用开源的东西我简单地改一改 , 然后我来做应用 。
那这些公司对这些大模型公司可能也会在产品层面是有竞争的 ,而它们的估值 , 它们的包袱可能都会小得多 。
第三个我觉得很直接的 , 就是如果进化速度放缓的话 , 那显然是不利于融资的 。 就大家还愿意去投这种这么贵的大模型的公司 , 那可能就是看中说你有一个最核心的技术团队 , 你的人才是最好的 , 你是不是有可能在技术竞赛上获得领先 。
那如果这个事非常有疑问的话 , 那融资肯定也是有问题的 。
对 ,其实说到模应一体 , 就中国有一个神奇的公司叫 DeepSeek, 它不但不做应用 , 它甚至这个公开说它们连商业化都不用去考虑 , 现在不要去思考商业模式 。
因为他们认为在今天就应该把公司所有的和大模型有关的人力 、 精力 、 物力 、 金钱全部放到对技术的探索上, 任何分散对技术探索的影响 ,不管是做应用还是去探索商业模式 , 想着这个早点要赚钱 , 都是对精力的稀释和分散 。
我能想到他们真是这个一股和所有人都不一样的神奇的力量 。
你说到这个我想到就是其实 6 月的时候我们和杨植麟聊过一次 , 我觉得他 somehow 他也表达了你说的那种想法 , 就是我最大的精力肯定是要放在技术探索和智能提升的 , 就是我要去追求智能的极限 。
但是另一方面就 DeepSeek 很特别嘛 , 你可以认为它在资源上也是非常非常强的吧 ,因为自己就是金主 ,因为它背后那个幻方这个公司本身做量化的话 , 它肯定自己的收益是挺大的 。
说到大模型 , 我们可能一会儿会说到的叫六小龙还是六小虎 , 反正我感觉好像这个说法都有 。
除了他们之外 ,其实就是还包括通义跟 DeepSeek。 通义大家都知道的是阿里的产品 , 然后 DeepSeek 它就是 , 我其实也看了一些 DeepSeek 的报道 , 我觉得这真的是一家很神奇的公司 。
就有一个说法就是 , 当然也是媒体报的 ,他们没有正面的回应跟证实这个说法 , 就是说 23 年的时候国内有超过 1 万枚 GPU 的企业不超过 5 家 , 除了几家头部大厂 , 还有一家叫做幻方的量化基金公司 。
创始人梁文锋他也在当时跟媒体说 , 最晚明年大厂跟创业公司都会把自己的大语言模型做出来 。
然后他在当时也说目标很明确 ,不做垂类 ,不做应用 , 就做研究 , 就做探索 。 最近我们也看到他们在外网上被评价很好 ,因为被 TechCrunch 报道了 。
文章反馈11:19
对 , 说到这个 , 就是这个跟文章发布之后有一个反馈我觉得也挺有意思的 。 我看极客上有一个叫凌晨 64 的一个朋友的转发 ,他就说在外网大家讲起中国的大模型 ,其实讨论最多的就是通义的开源系列和 DeepSeek, 然后在国内大家关注最多的就是 Kimi 和豆包 。
这个话题跟我等会儿想说的也有关系 , 就是说如果你不管这个技术进化快慢 , 还有一件事我觉得现在也是对这些创业公司有压力的 , 就是开源对闭源的压力 。
因为这些大模型公司头部的融资特别多的 , 它更多的还是在讲就是我自己有一个闭源的模型 , 然后我这个模型可能会比别人好 , 就开始大家讲的是这个故事 。
那其实你可以看到后面随着 Meta 和阿里 , 就是中美这两个最积极的搞开源的大公司 , 还有像 DeepSeek 这种非常特别非常神奇的 , 它也在搞开源的这些公司 , 贡献了挺多很好的开源模型之后, 那其实确实就有很多公司它可以直接在这个开源的基础上来做一些事 , 那可能也会和这些大模型的创业公司之间有一些竞争 ,也会给他们带来一些压力 。
然后回到就是说这个框架 , 就比如说我们能去看这个事最核心的就是它技术进化的速度 , 那这个事到底答案是什么 ?
我觉得这个市场最难的就是这个事它你很难给一个答案 。 首先它肯定超过大部分人的 , 反正肯定超过我的智力范围 , 就我肯定是说想不清楚这个事情 。
然后即使在从业者里面 , 你也会发现就是都是很厉害的 AI 开发者 , 对吧 ? 然后他们的想法也是不一样的 , 就是有种看神仙打架的感觉 , 然后你也看不明白 。
所以我觉得这是现在市场的分歧很大的一个核心的原因吧 。 我们这个文章里写的现象 , 包括我觉得之后可能再会发生的一些现象 , 它的根源其实都在这儿 。
我在操作这篇文章的时候 , 你们的起点是什么呀 ? 是当时看到了什么具体的信号 , 或者听到了某一个故事 , 就让你们想着要去做这么一篇内容 ?
其实文章操作的起点就很常规了 , 就我们肯定是商业报道嘛 , 你的主线就会有几类商业报道 , 对吧 ?
比如说单个的公司报道 , 或者某一些人物类的报道 , 这是一种 , 还有一种就是行业现象类的报道 。 那其实最开始我们操作这个文章的时候 ,在 11 之前定的大的方向就是想去盘点中国的这些头部的大模型创业公司 , 从去年到今年已经有了大概快两年的这么一个时间的变化 。
就当时可能并没有特别清晰的一个主线是说来重点地写他们和大公司之间的竞争 。 然后后面是随着你跟更多人聊 , 包括我们也去看我们从去年到今年跟很多人聊的一些之前的采访要点的回顾 , 然后你会慢慢就是能找到 ,也许这是一个能串起很多事的主线 。
而且我觉得对读者来说它也比较好理解 ,其实它就是一个故事母题嘛 , 就是一个竞争的大概就是这么一个过程 。
你刚刚说那个具体的事 , 对吧 ? 那肯定就是豆包 , 包括字节最近的这个声势确实很猛嘛 。
那文章发了之后到现在你们有收到什么反馈吗 ? 就是有什么大家的评论 , 比如说纠正一些文中的一些观点 , 还是说大家其实非常认同这篇文章写出来的东西 ?
我想先问一下, 比如说你们自己的反馈会是什么了 ? 就你们看到之后会是什么感觉了 ?
我看到的感觉就是我转发极客的那一条 , 然后当时第一时间就转了 。 就是我觉得把大家潜藏在心里的一些想法 , 甚至是一些共识 , 就是把它提炼出来 ,并且非常清晰有力量地写了出来 。
我觉得就凝聚了共识 , 凝聚了一种新的叙事 。
你那个转发还 cue 了新世相的 slogan 是吧 ? 我记得里面有潮水的方向这个字 。
潮水的方向 。
对 ,但是当然我们更多可能是个记录 , 就是你很难说什么改变潮水的方向 , 我觉得可能就是把它描述出来 。
我觉得比较有意思的复盘 , 一个就是你刚才说的这一点 , 就是有些肯定是表达共鸣嘛 , 就是有共同的感受 。
所以我觉得一方面是大家就会有一个相同的感受吧 。 然后另外一个就是我刚才说到的 , 就是这个中外关注差异是挺有意思的 。
就我们这篇文章里面确实没有特别多去讲这个开源和闭源的一些东西 , 我觉得这也是一个很值得探讨的话题 。
然后第三就是你们说的会不会有一些人觉得这里面有些东西不太准 , 或者说有一些纠正的东西 。 有一个就是关于我们里面用到的这个 Quest Mobile 的 30 日留存的数据 , 后来我们在文章评论里也置顶了 , 就是它那个数字就大家对它的质疑就是说它看起来太高了 。
豆包的 9 月是 34% 吧 , 就是它的那个 30 日留存 , 然后月岸的 Kimi 和 MiniMax 的海螺 , 就是豆包的这个类似的产品都是在 28% 左右 。
然后聊天陪伴或者说虚拟社交类的产品里面 , 猫香是 40% 多 ,44 好像是 ,MiniMax 的星野是 60% 多 , 对 。 就大家觉得太高了 。其实因为是平时可能就做产品运营的人 ,他们更关注的那个 30 日留存是新用户的留存 ,而 Quest Mobile 的那个算法它里面的那个留存就是说 , 比如说第 30 天后我还打开这个东西的用户数 , 然后它比一个总用户数 ,30 天你看每天都算 ,
然后算一个平均值 。 所以它的这个里面不光是新用户的留存 , 就是它是所有用户在 30 天内它又用的这么一个数 。
就一般来说它会比新用户的留存高 。 所以我觉得这个的话大家可能就更多是看一个数字关系吧 , 就谁多谁少这个可能能看一下 。
然后具体来说确实比市场里投资人或者是做产品的人所关注的那个新增用户的 30 日留存高 。
另外有一个比较有意思的反馈 , 就是文中早语就出现比较前的地方 , 就是一个大厂的高层说一年做大模型的低消就得要 20 到 30 亿美元 。
然后这个文章发了没多久就有一个投资人跟我说花不了这么多 , 然后他有个自己的算法 。
对 ,但不管这个低消多低 , 那个低消还是很高的 。 尤其在海外也看到这样的趋势嘛 , 除了 OpenAI、xAI、Meta、Google、Anthropic 这五家公司 ,其他都有点跟不上, 甚至 Cohere、Mistral 都有点跟不上 。
刚才提到的第二点就是中外的差异 , 一方面是在说海外关注千问 , 关注 DeepSeek, 甚至这两天推特上也有大 V 在讲说你看看这个芯片封锁没有用吧 , 人家非常的牛逼 。
然后另一方面就 Financial Times 11 月中也有一篇文章在讲说你们看芯片封锁没有用吧 , 中国的公司在干嘛呢 , 从阿里巴巴到字节跳动到美团 , 全部在弯曲做公司 ,在这里猛挖顶尖人才 。
所以其实确实就是在这样的这个技术浪潮面前 , 很多东西它仍然是流动的 。 那我们再说回来这篇文章 , 文章的开头就写得非常的吸引人 ,在讲的就是大家回忆起来去年投资人抢着投大模型创业公司的那个局面 , 然后到今年好像有一个各种各样的小道消息吧 , 都说已经有人开始在着急要卖老股了 。
那从年初的这个六小龙的状态我们去回忆的话 , 现在曼琪你还记得当时有哪些就是你印象深刻的事或者故事吗 ?
初期回顾17:56
对 , 年初那可能是指的去年初了 , 对吧 ? 因为去年初一开始就很火嘛 , 反正那个火热期的故事 , 就我知道杨植麟最开始是比较难见上的 , 就投资人想见他比较难 ,但这个可能也不是说因为跟公司特别火相关 , 就是我了解到的是他应该就是挺 I 的 ,他比较社恐吧 。
比如就有他的同事说杨植麟就是有提过说能不能就不要让我去见投资人, 我写一个文档 , 然后他去看那个文档就可以了 。
我觉得他们最近那个新闻发布会也很妙 , 我甚至觉得这个事就是 PR 顺水推舟 , 或者这个换一个更好听的词叫做就地取材 ,也不是那么好听 。
就是说这个杨植麟花了 40 分钟还是多少时间一个人在上面做数学题 , 然后把他一个这种科学极客的形象展现在所有的媒体面前淋漓尽致 , 然后反而得到了非常好的评价和好感 。
对 , 曼琪你是不是也在现场你有这样的感受吗 ?
对 , 我也在现场 。 首先我觉得他没有花 40 分钟在做数学题 , 没有那么长时间 。 就他可能整个他讲这个 Kimi Max 这件事他花了 40 分钟 , 然后中间他在那个做就给你演示这个 demo 的时候 , 那个时候是在给你讲数学题 。
那个我自己的体感我觉得可能也就 10 分钟顶天了吧 。 但是我自己的感觉 ,其实现场媒体朋友你从后面的那个标题的竞争你也能看出来 , 对吧 ?
开始有一个媒体的标题是他回应一切 , 后来又说他没有回应一切 , 后来又说他不能回应一切 。 对 ,其实大家的有一个感受还是觉得他没有回应一些就技术之外的事吧 ,也是市场比较关注的 。
因为刚好发布会的那个周的周一是有他们仲裁风波的那个报道出来 。
OK,anyway, 我们先说回来 , 就是再回到年初的时候 , 还有一些什么样的你印象深刻的故事 ?
我可能对最近的尤以奇的故事 ,因为更近一点嘛 , 我可能印象更深一点 。 就最近融资消息肯定是变少了嘛 , 包括上半年最大方的阿里 , 它其实到年终之后也会犹豫一些 。
之前小红书上不是也传这个嘛 , 就说它跳票了某一个大模型公司 , 对吧 ?
我们在小红书上看到好像是接月 。
对 , 你只能说它现在还没有投资 , 对吧 ? 就可能跳票这个也不准确吧 , 就总之看起来没有年初那么快那么劲爆了这些融资的消息 。
然后最近也有一个这个在网上流传甚广的八卦 , 就是说马云在一次会上问 , 为什么大模型创业公司我们阿里都要投一遍呢 ?
据说现场的大家是面面相觑 , 没有人能够回答 。 对 ,也没有人这个可以直接跟马老师说我们其实是为了卖阿里云 ,也没有出现这样的答案 。
所以在这个时候马老师又追问了一句 ,是不是你们没有看懂 ? 对 , 所以到这里也是想这个聊一聊 , 就是从什么时候开始有感受到大模型公司的发展没有想象中那么顺利吗 ?
尤其是这一批创业公司 。
其实我觉得不是他们发展不顺利 ,因为就是一个技术出来之后, 它最开始那会儿大家很兴奋很狂热 , 对吧 ?
然后过一段时间会变得没有那么兴奋 , 我觉得这是一个正常的情况 。 所以我觉得不能叫他们不顺利 ,而是在字节的衬托之下, 或者说在一些大公司的衬托之下会显得他们不顺利 。
就是可能在这个去年到今年, 我觉得就是它更反常的一件事情是去年大家还群嘲的字节的大模型和它的产品在今年却是表现得很不错 。
对对对 , 这个其实也让我想起十字路口之前有一期播客 , 我们是和真格基金的合伙人戴宇森聊 , 然后那期播客我们最后的标题就叫做 《 大模型还是小学生 , 请大家不要着急让它开始打工赚钱 》。
对 ,在讲的也是这个技术其实出现到现在 ,ChatGPT 发布 3.0 发布刚两周年, 在我们录播客这一天刚两周年, 但大家对它的期待好像是你必须已经要诞生出下一个 Meta 或诞生出下一个 Google 了 。
但去回溯这个 Meta 或者 Google 也是经历了 6 年、8 年、10 年才成为了一个在牌桌上大家认为看得上眼的 ,不管是 revenue 规模还是利润规模的这么一些企业 。
我觉得确实是大家心态很迫切 , 所以才会认为不顺利 。 但是换一个角度 , 它并不是不顺利 , 只是它没有大家期待的那么那么那么快 ,而这个期待本身可能就是有问题的 。
我有个感受是 , 很个人, 我觉得它也不一定准确 。 感受是你比如说夜之暗面像 Kimi 的产品 , 它其实一开始它的这个长文本已经还挺惊艳的了 。
然后像 MiniMax 的产品 , 它是一个当然最早因为他们主要面向海外, 我们其实也不太用 。 然后另外几家全是 to be 的产品 , 我们也感受不到 。
你就说那个为什么月岸最红是吧 ? 为什么 Kimi 最红 ?
我是想说就是大家好像感觉产品更新没有那么惊艳了的这个点上, 我觉得对让普通人来讲 , 对普通人或者是对写文章的记者来说 ,其实那种惊艳感就离自己其实相对来说是比较远的 。
然后再加上没有对标 ,是 o1 出来之后这个对标才又出来了 。
就本来你每天被爆炸被震撼也不正常 , 对吧 ? 就人不可能每天都被震撼 。
对 。
曼琪就是在写这篇文章的时候 , 我相信你们应该是对现在的六小龙 , 就六家大模型典型的创业公司都去做了比较全面的盘点 , 可不可以也请你分别给大家讲一讲你们观察到他们现在六个公司的一些关注的重点 , 发展的一些进程 ?
对 ,因为其实里面有很多关注 , 比如说 Kimi 的话 , 我觉得它现在其实是比较明确的 , 就是他们要做好 Kimi 这一个产品 ,而且他们的品牌上也是往 Kimi 去收束的 。其实现在月之暗面自己对外去提到自己这家公司的时候 , 它经常也会用 Kimi,而不是用月之暗面这个名字 。
各家公司23:33
还有一个冷知识 ,但这个可能也很多人知道 , 就是杨植麟自己的英文名就叫 Kimi, 所以他现在是创始人, 然后公司的这个品牌 , 然后这个产品它其实都叫 Kimi。
而且因为杨植麟自己叫 Kimi, 对吧 ? 那如果在公司里的话 , 就是为了区分我是在叫这个创始人还是我在说这个产品 , 就会把杨植麟叫做 KK。
就他们把杨植麟叫 KK, 然后指产品的时候他们说 Kimi, 这样就会好区分一点 , 算是个冷知识吧 。 但它的最大的一个策略我觉得就是现阶段我就是要做好 Kimi,以及我要去做生产力这个场景 。
然后 MiniMax 的话 , 我觉得它其实在 ChatGPT 之前它就有产品出现了 , 它最开始火的那个产品 Glow 其实是 2022 年的下半年就上线了 , 它确实是尝试的比较多 。
然后目前它 to C 产品的重点肯定是在星野的那个出海的产品 Talkie 这个上面 , 同时它开放平台也是做的比较多的 , 就是它 API to be 的那部分 ,而且这个应该是他们比较重要的一个收入的来源 。
零一的话今年其实也有很多调整 , 我觉得它现在也比较清晰了 , 一个就是它出海要做 to C 产品 。
我之前还看有人在小红书上吐槽说零一没有产品什么的 ,其实零一是有产品的 , 我觉得这么说有点冤枉他们 。他们只是不太喜欢说自己的产品名字 ,因为现在就是出海其实如果你是一个比较大体量的公司 , 出海是有一点压力的嘛 。他们产品是不少的 , 然后最近他们刚上线了两个 AI 搜索类的产品 ,AI 搜索可能是接下来一段时间他们 to C 的产品
的一个重点 。 另外他们最近还 spin off 了一个游戏的公司 , 会由他们的联创之一马杰来带队 , 这个我们之前在有一篇独家报道里写过 。
同时零一也在做 to be,而且它这个 to be 的做法的话 , 就已经在之前的这个 API 上面又加了一些别的东西 。
就 API 其实大部分这个大模型公司做 to be 都比较惯常的一个操作嘛 。 那零一在这个中国市场 , 它还最近它开了一个 to be 的发布会 , 它针对一些场景有这种更完整的方案 , 当然也不一定是完全自己来做 , 它和有一些 ISV 会去合作 , 这样的话它自己可以做得稍微轻一点和标准化一点嘛 , 就针对这个营销场景 、 直播什么的 。
对 , 我看他非常重点在讲这个虚拟数字人直播 。 前段时间其实十字路口有一期播客 , 就是我们那个 AI 在中国系列其中的一期 , 就找到那个在 to be 领域有 PMF 的一位创始人, 其实挺不容易的找到这么一位创始人 ,他是极思科技 。
然后他们做的其实就是虚拟数字人直播 , 这是一个确实这个落地场景还蛮明确的 , 需求也蛮明确的一个地方 。
对 , 只是我就稍微有点怀疑这个整个市场规模 , 对于一个创业公司来说是不错的 , 从零到一起盘 ,但对零一来说这个能够扛起它多大的这种责任和开佛老师的野望 , 这个我看到的时候是有一点问号的 。
对 ,其实这个就回归到我们开头说的那个问题了 , 就是说如果你去一些具体的地方做一些好像看起来更细节的场景的产品 , 对吧 ?
那这个里面有很多那些我根本就不做模型的公司 , 对吧 ? 我也没融那么多资 , 我也没有那么多人的期待 , 我就可以很轻很灵活的去做 。
就是这些大模型公司在这些具体的场景上跟这些公司也有竞争 , 这大概是就零一 to be 的一个情况吧 。
然后智谱的话 , 智谱其实一直以来它 to be、to C 都是它的重点嘛 。 我们了解的情况是智谱今年的合同收入和去年是差不多的 , 就一方面看起来它好像没什么增长 ,但另一方面其实去年他们做一些这种定制化的模型开发的客单价是很高的 。
就去年有几个中国的那种金融行业的大客户 ,他能给 1000 万的订单 , 那今年可能一个项目就差不多的一个项目 , 可能它的价格就急剧的下降到只有比如说 100 万甚至更少 。
那从这个角度去说的话 , 那智谱也许拓展了一些更有质量的弊端和积端的收入 , 这个具体的我不是特别了解 。
我感觉智谱现在把非常多的重点都放在去讲他们的 AutoGLM 这个事情上面 , 发布了第一版之后确实有很高的市场的这个反馈 , 然后紧接着在这个礼拜 , 就前天 ,他们又发了一个发布会 ,GLM 的更加正式的一个版本的一个释出 , 然后还拍了非常精美的视频 。
那我觉得这个也是他们现在一个比较主要的方向吧 。
他们这个是可以和手机合作的是吧 ?
对 ,在最近的发布会上出现在广告里面的那台手机就是荣耀的 Magic 7 的系列 。
那我觉得可能他们就是会有合作 , 我觉得市场也可以期待一下吧 。
但其实我自己还是非常困惑 , 就类似 AutoGLM 这样的功能 , 它到底在现实场景当中对用户有什么样的价值 。
就我仔细的把它的 demo 都看了个遍 , 看下来我觉得是比第一版要更流畅丝滑聪明了一些 ,但是举的那些例子就有一种就是为啥我要这么操作 , 我自己点几下屏幕去下个外卖单 , 去叫个滴滴 , 为啥我就非得要用语音去让它来操作 。
对 , 那可能我能想到的就是觉得点手机很麻烦 , 然后人变得更懒了 , 可能有这个需求 。 就如果它够好用的话 , 我觉得是有这个需求的 。
就你刚刚说的准确度可能会是个问题 , 就如果你特别不准 , 对吧 ? 然后我搞半天又搞不出来 , 那就没啥意思 。
还有一个接月 , 接月他们的信息其实是相对比较少的 , 当然他们做了些 C 端应用 , 这个是你可以从公开你可以看到的 , 月问 、 冒泡鸭什么的 。其实说到接月 ,他们最近在 C 端其实做了一些爆款的 , 一个是歌词爆改机 , 然后还有一个是前两天刚发布的叫做灵魂提取器 。
但是他们都好像比较重点在讲说这些产品只是用了接月的 API,他们并没有去重点讲说这些产品其实是他们自己 in-house 做出来的 , 这个还蛮微妙的 。
或者说这个策略背后是他们还是长期希望是一个 to be 的公司 ,而不是一个 to C 的公司 ,因此哪怕做出了爆款 ,也希望大家控制一下预期 ,不要觉得接月从此就 to C 了 , 甚至都不让爆款的这个这些带来的 traction 落到自己头上来 。
对 , 接月还是有一些挺厉害的人的 。 那个张翔宇现在也在接月嘛 , 就是之前何孙健 , 还有任少钦 , 还有一个人是谁 , 一作是谁来着 ?
何凯明 , 一作是何凯明 ,他们做那个 RestLite 的那个 , 当时应该是中国计算机视觉领域吧 ,在全球最有影响力的一个成果 。
然后朱一博也在接月 ,而且朱一博是 23 年初的时候应该是从 Meta 回国加入的这个公司 。 对 , 然后六小龙里还有一个 , 还有百川 。
百川的话 , 我觉得大家也都能看到他的变化 ,其实去年的时候王少川应该是想做这种 to C 的超级产品的 ,他曾经是有这个想法 。
然后到现在我觉得他们是比较明确自己的思路 , 我要来专注做医疗这个场景 。 我觉得客观上这确实也避免了和巨头的一些竞争吧 , 就你不在这个火力最强的战场上 ,但是医疗这个场景本身它的壁垒挺高的 , 商业关系也比较复杂 。
Kimi MiniMax30:39
我们比较关注的多一些的公司是 Kimi 和 MiniMax, 这两个公司我觉得他们的对比也很有意思 。 就 Kimi 的话我刚才说了嘛 , 就是它是有一个比较明确的主线 ,而且这件事至少杨植麟他跟我们聊 , 包括他对外沟通 ,他自己的逻辑是很自洽的 。他说我就是要去做生产力这个场景 ,以及我要追求智能的最大提升 。他认为生产力这个场景跟智商提升的关系更大 ,而娱乐社
交类的产品他觉得对智能的需求没有那么多 。 然后生产力确实也被大家认为是一个价值很大的场景 。其实 ChatGPT 它部分是验证了这个判断的 , 就是到今年 8 月底的话 ,OpenAI 它自己有证实的一个数字 , 就是 ChatGPT 的周活是到了 2 亿 。
那今年初的时候它的周活跃用户数应该是 1 亿左右吧 , 所以它不到一年的时间里它又翻了一倍 。
某种意义上你可以说它已经是 AI 领域我们看到的一个 super app 了 。
非常牛逼 。 对 , 还有那么多套壳的 APP 呢 , 都没有算在里面 , 它只是算自己的官方客户端 。
对 , 它算的就是自己的 。 所以我觉得这就是一个价值很大的方向 。 而且我觉得杨植麟的想法肯定是 , 就他的野心或者你知道他的抱负都是很大的 。
因为我又去看了我们六月聊的一些情况 ,他当时在讲这个生产力的产品的时候 ,他有一句话就是说 , 最终才会真正成为通用的入口级的产品 , 就是在解释他为什么要只做 Kimi 这一件事的时候 。
所以觉得他设想的未来就是我要找到一个入口级的产品嘛 。他这个策略当然有一个也很明显的问题 , 就是你是这么想的 , 然后别人也是这么想的 , 对吧 ?
那字节也是这么想的 。
对 , 所以豆包才如此火力全开 。
对 ,因为其实 Flow 就是字节的这个 AI 部门 , 它有很多很多产品 ,但是豆包显然是它投入的力度最大的一个产品 。
不光是说在投放上大家能看到的 , 就比如说你像能刷到豆包的广告 , 另外从组织和人员安排上也是 。
因为朱俊就是 Alex Zhu 之前 MusicLite 的那个创始人 ,他是整个 Flow 的负责人, 然后他自己带的产品就是豆包 。 就豆包什么 , 比如说豆包有网页端的负责人, 有 APP 端的负责人, 有些什么负责人, 都是给朱俊汇报的 。
那我觉得从投放上, 从组织结构上, 字节肯定都还是非常看重豆包这个产品的 。 所以 Kimi 选的这个方向 , 它就是和字节或者说和大公司的必争之地会有一个比较正面的竞争吧 。
然后 MiniMax 的策略 , 就它的产品策略 , 我觉得它是比较灵活的 , 它会去尝试很多 。 不管是因为它最开始那个 Glow 反正就莫名其妙的可能就火了 , 就可能是个偶然性的因素 , 还是它有意识的策略 , 就是你能观察到它现在的结果就是他们做的这个方向不是那么直接和大公司竞争的方向 。
就是在星野这一类产品里面 ,其实字节也做了猫箱嘛 ,但是猫箱的表现现在应该是不如星野的 。 这个我们在文章里也有一些具体的数据 , 包括这两个公司的产品带来的反馈也很有意思 。其实我年初的时候我自己还做了一个短视频 , 我还讲了下这个事 。
我觉得 Kimi 为什么这么火 ,有一个原因就是 Kimi 的目标用户 ,他刚好就是最关注 AI 的这些人, 什么投资人 、 分析师 、 媒体记者这些 , 就是知识工作者 。
所以你又关注 AI, 然后你又觉得这个产品特别好 , 它就会给你带来这种经验感 。 然后这些人可能在社交媒体上又是最喜欢去讨论这些事情的 , 比如说小红书上或者极客或者朋友圈 , 对吧 ?
然后我自己经历的一个特别好玩的事就是 , 今年清明节的时候我去爬山 , 就是一个创投圈朋友组织的 , 去爬山的这些人很多人都是相互不认识的嘛 , 那大家聚到一起就要开始自我介绍 , 然后中间有一个人不知道是谁就开始说了下 :" 我刚才来的路上我还在用 Kimi 干嘛干嘛 。"
这个自我介绍环节就变成了一个 Kimi 使用分享会 。 就后来每个人都在说我在用 Kimi 干嘛干嘛 , 然后这东西非常好用 。
就它确实在三四月 、 四五月的时候 , 这种自来水的传播 , 这种口碑的传播是非常强的 。 当然有一个原因是那会儿豆包也可能还没那么强 。
星野的用户就特别有意思 , 就比如说我自己也下了星野 ,但是我就玩不起来 , 就我不是它的目标受众 。
我觉得大部分投资人可能也不是它的目标用户 。 但是如果你去看这些它的用户在社交媒体上的分享的话 , 你就会发现这些人其实非常疯 ,他们很沉迷这个东西 。
就 B 站上以前就有很多 Glow 的那种什么养娃的视频 ,其实你点进去之后可能都不知道这个视频到底在讲什么 , 然后弹幕里也都是一些有点黑化的东西 。
我也在小红书上看到过 , 就是有人分享在星野上养娃的这种情感体验 ,他们里面就这个用户里面已经形成了很多小圈子的话语了 ,其实你有些看不太懂 。
然后那个帖子可能有 8000 的点赞 , 然后有 1000 多的留言 , 就是你能感觉到这些用户对它的情感投入是很强的 , 粘性是很强的 。
这个其实从那个 30 月留存的数据也能看出来 , 虽然猫箱和星野比它没有那么好 , 对吧 ? 但它也有 40% 多的月留存 , 然后它比豆包其实是更高的 , 然后星野自己的留存就更高 , 它是 60% 多 。
所以其实看下来两个公司是走了非常不同的两条道路 。 那因为你和两位创始人都分别做过比较深度的采访嘛 , 你觉得这和他们本身的成长或者他们本身的信仰是有非常直接的关系吗 ?
对 , 首先我想说就是你跟他们采访过肯定也不算了解这个人特别全面 。 我只能说一下我的感受 。
我觉得 MiniMax 的创始人就是闫俊杰 ,他确实他有一个想法 , 这个也是 MiniMax 自己很早内部的一个 slogan, 就是叫 Intelligence with everyone, 就是他觉得要做一个 AI 产品 , 这个产品是大部分人都可以用的 , 那这个东西的门槛就应该很低 。
然后他接受我们采访的时候 ,他也说到他当时的原话大概就是说 :" 每天会打字的人不过就是在做的各位 。"
他的意思就是指一些知识工作者或者办公室白领之类的吧 。 如果你真的要让这个东西更多的人用的话 , 得让它有语音的功能或者其他的 , 比如视觉什么多模态的这种功能 。
这也是为什么其实 MiniMax 一开始它就是这几个模型都在做的 ,而且它应该算是国内的公司里面语音模型做的还可以的 , 对吧 ?Koji 可能可以给我发言权 , 我不知道你试过他们的没有 。
对 , 我觉得他们视频模型做的更好吧 , 就更加有口碑 。 尤其最近遇到的各种创业者或者朋友说试了各家大模型下来之后, 包括我自己试下来 , 我也觉得其实 MiniMax 的这个视频模型的表现确实非常的突出 。
但我觉得这里面也是有一点 , 怎么说呢 , 就再往前看 ,MiniMax 做视频模型据说也就是十来个人。 应该在我们这期播客发的时候 ,其实腾讯混元的视频大模型也已经正式发布了 。
然后我在做内测的时候也很惊叹 , 水准非常高 。 而字节也有两个团队在做视频大模型 , 比较低调 , 没有特别多的 PR,但是用过都觉得挺好的 。
所以在字节和腾讯 , 包括未来可能也有阿里的这样的巨头的围剿之下 ,其实创业公司还是有难熬之处的 。
只是说这个看在现在有领先的情况之下, 能怎么样的尽快多打开一点局面 。
对 , 我刚刚说的是闫俊杰的想法 。 对 ,他这个想法肯定如果你再往后发展也还是会受到竞争压力吧 , 就还是一个时间窗口的问题 。
然后杨植麟的想法的话 , 我觉得至少他对我们表达的就是他想做一个智能有明显提升的东西 , 就这个场景能促进智能的提升 , 然后同时它又有人用 。
我觉得它有点类似于一种就是我要去攀登一个技术高峰 , 然后我沿途会下一些商业化的蛋 , 好像有点这个意思 。
不过我觉得随着市场环境的变化 , 可能他们都会有些调整吧 。 然后关于这两个人, 我有一个比较有意思的发现 ,但我觉得这可能不能说明什么 。
就是一些投资人会觉得杨植麟他是比较看准一个方向 ,他认为我就这个大方向 , 我就往这方向做 ,他比较笃定吧 , 你可以说 。
然后他的微信签名是 I'm a million different people from day to next 如果翻译成中文就是我朝夕变化不定 , 大概这个意思吧 。
这是一句摇滚乐的歌词 ,因为他自己很喜欢摇滚乐嘛 。 然后我们当时也有问他这个微信签名 ,他的解释就是我的长期目标是不变的 ,但我也要快速迭代 。
然后 MiniMax 的产品策略看起来好像是比较适应性的 ,是比较灵活的 。 然后闫俊杰的微信签名是 To find the more stable formulas 就是我要找到更稳固的方程 。
就我觉得它有一种微妙的对照 ,但这可能也说明不了什么 。
挺好玩的 , 我觉得 。 最近那个我们也在做一些这个产品的尝试嘛 ,其中一个尝试就是让用户上传自己的朋友圈和朋友圈的各种截图吧 , 自己的或朋友的 。
然后这里面可以解读出非常多的东西 , 甚至可以生成你的恋爱报告 。
你说到这个我突然想到一个事 , 就是我觉得有的时候如果能 AI 帮我生成签名也不错 。 就有时候你去一个新的社交平台的时候 ,有时候要想个签名。
我们最近发现这个用户传他的朋友圈的截图上来 , 传个哪怕只有封面 , 就只有第一屏的图 ,其实都能够蛮准的推测出这个人的很多性格特点了 , 甚至还能推测他是安全型依恋还是焦虑型依恋 。
我们最近在尝试做一个这个 AI 帮你更好的了解自己 , 从而更好的脱单找对象 , 这样的一些产品上的尝试 。
就这个 demo 做出来之后, 用过的人都感觉很惊叹 。 然后过段时间我们发布出来 , 欢迎大家来更多的尝试和使用 。
但是我能想到的就是你这个东西发出来之后, 大家用的很广的一个用途可能不是用它来理解自己 ,而是用它来 , 比如说我去看一下暗恋对象是个什么情况 , 我把他的朋友圈的对吧 , 第一屏截下来 , 然后我想去追的这个人什么情况 , 或者我去看一下我领导什么性格 。
这个也很好 ,其实就是在帮助大家提高理解别人的能力 , 看见别人的能力嘛 , 对吧 ? 其实如果人人这方面的能力都变高了 ,其实这个世界会变得更有情绪价值 。
Good AI, 对吧 ?
哈哈哈哈 。 这里我们预告一下 " 新世相 " 和 " 晚点 " 即将发布一个非常有意义的项目 。 就我们联合了 20 位行业里面还蛮有影响力的创业者和文化人, 我们会一起来发布 Good AI 的一个宣言 , 就是 AI 将如何帮助人类 , 帮助我们的社会 , 一个非常宏大 , 我们有点不自量力吧 , 这么一个宏大的命题 。
那它应该做到哪些应该做到的事 , 我们列了 10 个点 , 我们会共同来发布这个宣言 。 那到时候我们也会在播客里面和大家介绍 。
嗯 , 提前预告挺好的 , 提前预告就板上钉钉 , 绝对不能跳票了 。
好的 , 那我们再说回来 。
人才流动40:44
就最近我们发现一个现象是 , 最近宣布融资的一批创业者 , 多多少少都是从去年成立的这些模型公司里出来的人。
就是你有感觉这种现象说明了什么事吗 ?
对 , 我们有些独家报道里也写了 , 比如说月站面他有一些产品的负责人出来 , 之前他有两个出海的产品 , 一个叫 OHA, 一个叫 Noisy 的 , 这两个负责人都出来了 。
正好这个也可以补充一下, 前面就说 Kimi 他想就只做 Kimi 这个产品 ,他其实在这个过程中间他是有尝试一些别的方向的产品的 ,但是据我们了解的话 ,他们确实在这些产品上投入的力量也不是特别多 。
而且这些产品可能到现在他就不是一个说我正常在更新和我去继续投入的这么一个状态了 。 更早的时候 , 今年他们还有一个产品负责人叫王冠也是出来创业了 , 包括就是这个我们写到过的 Noisy 的这个负责人叫明超平的 , 后来我发现他很小 ,他是 98 年的 , 就年纪也特别小 , 特别年轻 。
而且他这个项目的第一轮的估值应该就到 5000 万美元了 , 就其实他也非常受市场追捧嘛 。 所以我觉得这个事就是至少说明了你目前来做 AI 应用 ,其实市场还是有些人是很愿意支持的 ,而且他还会是以一个比较贵的价格他也是愿意支持 。
这还是回归到了我们前面说的 , 如果大家认为这个模型本身的进化没有那么快的话 , 那其实就会去更多的看应用是不是有机会 ,而且是一种更轻的方式来做应用 。
对 , 我其实觉得这些出来的这一批创业者他们做的事我也觉得都挺有意思的 , 比如王冠他们 One2X 应该在做 AI 视频相关的尝试 , 然后大鹏还是很坚定的要去做生产力工具 , 然后明超平是在做 AI coding, 对吧 ?5000 万美金的估值 。
那可能公司和这些出来的人他的视角就是不一样的 。 有一个比较有意思的事就是杨植麟发 Kimi Max 数学模型的那一天 , 后面不是有群访吗 ?
就有媒体在问他这个很多人出来创业 , 包括你们公司可能有一些人才流失 , 你怎么看这个问题 ? 杨植麟的回答还挺有意思的 ,他说大概是先问是不是再问有没有 , 反正就知乎的那个标准回答我的开头的那一句 , 我不太记得原话怎么说了 。他想说的就是其实我们这没有人才流失 , 我是因为我自己业务要调整 , 对吧 ?
我可能不做出海产品了 , 我精力要收缩了 , 所以才会有一些人离开 。 我觉得他说的是一个比较委婉的说法 , 意思就是说其实我现在不太需要这一部分人了 , 这可能导致一些人的离开吧 。
就如果总结来说的话 ,其实就是有些大模型公司它的业务在调整 , 会导致一些人员的变化 。 然后另一方面就是说这些人出来之后, 你不管他是自己想出来还是说公司有调整所以他们才出来 , 那他们到底受不受市场的欢迎 ,其实我觉得他们就是非常受市场欢迎的 。
这个你从融资 , 你从这个后续的比如说谁谁谁又想投谁 , 对吧 ? 你都这个都是能看出来的 。
比如说月站面的明超平出来之后 ,他做 AI 编程这个方向 ,他第一轮估值就有 5000 万美元 。 这个如果你回到 16 年、15 年那会儿硬科技创业热潮的时候 , 这算是非常高的一个估值了 。
然后还有这个王冠他应该也是出来没多久 ,他应该也是融到资的 。 所以我觉得这个本身也和我们开头说的就是那个核心的假设 , 就是到底技术是快还是慢是有关系的 。
可能有一些投资人的判断就是觉得那我之前模型的这种爆发增长可能到了一定的阶段了 , 那现在也许应用就会有更多的机会 。
那我们再回到这个文章里面提到的一个数字 , 就是 20 到 30 亿美元 。 这提到是大模型公司在现在每年的烧钱的门槛 。
烧钱竞速43:58
那刚才曼琪也说这个文章发出来之后, 你们收到了一些不同的对这个数字的点评 , 这里可不可以稍微展开一下 ?
就我们说的那个 20 到 30 亿美元确实就是大厂的高管可能是这么认为的 。 然后也有投资人他算的这样就是说这些创业公司其实一年蛮大买 , 蛮算的话 2 亿到 3 亿美元就差不多了 ,是因为他说这个现在训一个模型也就是千万美元级别 , 然后万张 H 卡的租金也就是几千万美元一年 。
而且训模型其实你也不需要训一年嘛 , 一般可能一个模型你就是训几个月 , 对吧 ? 所以他就说你简单算一下这个事离 20 亿美元就很远很远 。
我们没有特别展开聊这个算法 ,但是他说这个话肯定是有几个前提嘛 。 首先他这里说的公司肯定还是继续在做模型训练的公司 , 要不你这个训练的费用你都不用算 。
然后另一方面我觉得他这里说到的这个更便宜的训练成本 , 包括之前李开复也说到说他们做一些那个模型训练的时候 ,他达到和 XAI 的一个什么成果差不多的效果 ,他可能只花了人家 1% 到 2% 的成本 , 对吧 ?
那我觉得有一个原因是因为你去跟随一个技术的时候 , 你可能没有算你在就是没有路的那种情况下, 你去前瞻性投入去探索的那个成本 , 那个成本可能是很大的 。
就相当于你跑马拉松 , 前面有人在帮你跑嘛 ,在给你顶风 , 那你可能后面确实成本会小一点吧 。
然后另一方面我们可以看一下 OpenAI 的花费 , 就是 Information 的报道 ,OpenAI 在 2022 年的时候 , 那会儿它还没有大火咯 , 它那年就花了 5.4 亿美元 。
然后今年 6 月的一篇文章里面也是 Information 的一个报道 , 它的测算是说 OpenAI 今年全年可能要花掉 70 亿美元 ,其中它光是给这些研发人员的成本就有 15 亿美元 。
当然可能美国的人特别贵 , 美国的这个 AI 研发者可能特别贵 。 那篇文章的标题就是叫 Why OpenAI could lose 5 billion this year 就为什么 OpenAI 今年可能会亏 50 亿美元 。
所以其实 OpenAI 的投入还是非常非常高的 。 那这个说回来它又扯到现在就中国大模型公司的一个两难的境地吧 , 就是说其实在中国的这个市场容量之下, 你可能很难融到那么那么多钱 , 让你真的能无后顾之忧的去追求这个技术的极限 , 对吧 ?
你很难像 OpenAI 那么多钱 , 那你就得有点商业化和增长的东西出来 。 但你想同时做好技术和产品增长和商业化 , 就本来就是一件很难的事情 。
对 , 所以又回到这个我们一开始聊到的 , 看千问 , 看字节的模型 , 然后以及看 DeepSeek, 就这些跳出六小龙 , 跳出创业公司框架的巨头也好 , 或者本身手握重大资源和大笔财富的这样的玩家 ,他们代表中国会做出什么样不一样的前瞻性的成果出来 。
对 , 我觉得至少字节和 DeepSeek 肯定很明显在模型层都是有这个想法 。
像刚刚曼琪已经说到的就是有一些挑战是由模型这个事本身决定了 , 就是比如说耗钱耗资源 ,有很多事情在中国可能很难去对标硅谷发生的事情 。
那除了这些的话 , 对创业公司 , 这里我们指的创业公司是指这几个模型公司 , 那就是他们的挑战 , 比如说在组织跟人的这个方面上你觉得体现在哪呢 ?
我们其实有很多那种非常零碎的信息 , 就是关于他们的组织和人的 。 但是我们文章里其实呈现的不多 ,是因为我觉得早期公司员工的视角里觉得老板的决策变化得很快 , 对吧 ?
我今天要增长 , 明天要收入 , 今天又要增长 , 明天又要收入 , 或者说我之前说我要干嘛 , 后来又干嘛 , 这都很正常 。
就这些公司它现在这个处境里面 , 它要考虑很多因素 , 它不是一个单一的因素 。 首先我觉得高估值就是一个卡点 , 高估值本身就会导致后续的融资变难 , 然后又加上模型能力的进化的方向没有那么明确 , 它的速度也没有那么明确 , 再加上这个产品体验或者说你的增长没有那么有说服力 , 然后同时大公司还在全力出击 。
产品这其实也可以展开说一下, 我今天还特意去查了一下今日头条当时的情况 , 我查这个东西我就是用豆包和 Kimi 去帮我查的 ,因为历史数据很难搜 。
今日头条是 2012 年 8 月上线的嘛 , 那我想知道到 2013 年的时候 , 就差不多就是去年比如说大模型的产品到今年有个小一年的时间 , 如果对比一下它是一个什么表现 。
那我可以看到的数据是到 2013 年 2 月底 ,也就是今日头条上线七个月的时候 , 它的日活就到了 200 万 , 然后到 2013 年年底的时候 , 它的日活就到了 1000 万 。
那如果你用这个来对比现在创业公司里的 Kimi 的话 , 今日头条当时作为一个创业公司的新产品 , 它的增长确实还是更快的 。
而且你还要考虑到在 2013 年的时候 ,其实你的流量成本没有那么高 , 现在的流量成本肯定比当年要高多了嘛 , 那那会儿还是移动互联网的早期 , 还要考虑到当时百度可能没有看懂这个推荐算法这个事 , 对吧 ?
他可能当时并没有在很早的时候就意识到我就要来盯着这个创业公司 , 百度那会儿也许觉得你根本就不怎么样 。
所以你回头来看的话 , 今日头条当时的增长和它的环境都会要更宽松一些 。By the way, 我说一下, 我觉得在帮我查今日头条的历史日活数据上, 豆包确实要表现得更友好一些 。
那个 Kimi 和豆包其实都给了就是 2013 年底是 1000 万的这个数据 ,但是你当你进一步去追问 , 就是你这个数据到底是哪来的 , 你的源头是什么 , 它豆包的解释 , 至少它返回的这个东西给用户来说是更友好的 , 它会直接在生成的文段里面 , 它会告诉你是说我在哪篇文章里看到它提到了这个事情 , 还有哪篇文章也提到那个事情 。
然后你在手机上的话 , 你去点那个没有那么方便嘛 , 就你点到那个外链没有那么方便 , 或者说你直接在那个里面能看见 ,不用点外链的话你省了一步 。
但是 Kimi 就是它不会直接在那个生成的文段里告诉你说我这是从哪篇文章里看到的 。 而且到了后面它又说那个今日头条 2013 年底的日活是 100 万 , 我问它到底是 1000 万还是 100 万的时候 , 我觉得它就有点乱了 。
就说回来的话 , 就刚才也说了产品的一些问题嘛 , 所以我觉得这些公司现在的挑战就是它不是要解决一个难点 ,而是它有好多因素要去调整 , 要去考虑 。
而且你动了一个事 , 你可能就会影响别的事 。 比如说今年更早的时候 ,在大模型创业公司里面也有一个引起比较多讨论的话题 , 就是当时应该是有一个报道提到至少有两家六小龙已经停止预训练了 。其实你回头看 , 你就说这个停止预训练这件事 , 它是不是就一定不对 ,也许它也是一个理性的选择 ,是吧 ?
反正创业的话你也不要怕打脸嘛 。 就这个事带来的一系列后果里面 , 我觉得打脸和没有面子是最最最最其次的 。
你创业肯定是会打脸的 ,但它也有一些现实的问题 。 就首先就是你这个估值能不能撑住 ,因为最开始大家去投你的时候 ,他可能是期待你有一个核心的技术上的优势 , 那你不做预训练了 , 你这个估值还能撑住吗 ?
当然另一方面你不做预训练的话 , 那你能做出一个真的说很有价值的产品 , 你要是能顶住这几十亿美元的估值也 OK, 对吧 ?
但是这又带来一个问题 , 就是我最开始我就是以一个大模型的技术去组织的核心团队和创业班底 , 那这个班底到底能不能做出爆款的产品 , 那可能大家也是打一个问号 。
对 , 所以我觉得他们现在的处境确实是比较艰难 , 就各种事是纠缠在一起的 。
对 , 反正听下来我都感觉到替他们捏把汗 。 那我们 anyway 了 , 还是就是祝福鼓励 , 希望能够看到六小龙都能够发展得越来越好 ,因为他们发展得好 , 我觉得整个中国的创投生态才会越来越好 。
而在所有这个生态系统里面的每一个角色 , 都能够得到更多的机会和更强的能量吧 。 就大家不管是工作事业还是日常生活都会变得越来越好 。
好 , 那我们这个再往下聊 , 就是我们说到初创公司的挑战之后, 再来聊一聊字节 ,因为今天之所以要聊他们的挑战 , 很大一部分的压力就是字节给带来的 , 一个又有资源又努力 , 大象都会跳舞的公司 。
字节起舞51:39
然后我们之前看到一个朋友在讲 ,2023 年是字节给了做 AI 的创业公司们一年的窗口期 。 那曼琪根据你们的采访和了解 , 字节在 2023 年这一年它在干什么 , 为什么会说它给了大家一年的窗口期呢 ?
我们文章里提了一句 , 就是说字节在 ChatGPT 之前 , 可能他们的高层更关注 AI 的另一个进化的方向是 AI for Science。
当然我觉得这个方向肯定也是很有价值 , 比如说今年的诺贝尔化学奖其实也是给到了 AlphaFold 嘛 ,AlphaFold 可以算是 AI for Science 的其中一个方向的进展 。
这涉及到一个我觉得另外的有点题外话的有意思的事 , 就是中国和外国的不少大佬他们到了后期都对生物科技非常感兴趣 , 比如说 AI 和生物的结合 , 生物科技的结合这些比较上心 。
然后字节在这方面确实我觉得它的积累是不如中国其他的大公司的 , 至少你从公开信息上看来是这样 。
我们 23 年的时候其实也发过一篇文章 , 就叫做 《 大厂大模型 》,是盘点当时的中国的大的科技公司在大模型上的一些动作和投入 。
然后那个文章里面有一个时间线 , 就是我们去看了一下中国的大公司是什么时候开始做大模型的 , 然后你就会发现其实百度确实做得最早 , 它 2019 年就发了 Ernie 这个模型 , 就是后来文心的前身 , 只不过它当时可能用的是谷歌的 BERT 的那个架构 , 它还不是 GPT 的架构 ,但它们都是大模型 。
再往后的话就是 21 年的时候华为有盘古 , 对吧 ? 然后阿里也发了 M6 和 Plug 这两个模型 , 然后这两个模型后来都是合并到通义里面了 , 包括商汤也发了书生 , 甚至大家觉得很拉胯的腾讯 ,其实它在 2022 年 ChatGPT 之前它也是发了模型的 , 它 4 月的时候就发了混元了 , 到应该是去年 10 月左右吧 , 微信自己也发了一个微信的大模型 , 叫那个 VLM, 就
他们都是比字节有 。
前年, 前年 。
前年, 对 ,2 年 10 月它也发了这个 , 微信也发了一个自己的大模型叫 VLM,其实他们从公开动作上都是比字节早的 。
这里面有几个可以说一下的 , 一个就是华为的这个 21 年的盘古大模型 , 它其实当时就是还在循环的杨植麟和北京智源的一些人和华为一起合作去做的 。
所以为什么就是资本市场最开始是非常认杨植麟的 , 我觉得也跟他之前这个经历有关 , 就他确实在技术背景上是非常相关的 。
然后像商汤的话 , 那个 MiniMax 的闫俊杰之前是商汤的嘛 , 所以我觉得它 23 年字节反应比较慢 , 可能也很正常吧 ,因为你之前在这方面的技术积累也许就是不如别人的 , 你追肯定也是要花一个时间的 。
比如说我们了解到就是在 ChatGPT 之前 , 字节的 AI LAB, 它里面的 NLP 组 , 就是自然语言处理组 ,因为这个是和大语言模型最相关的 , 然后这个组有 100 多人 ,但里面大概也只有 10 个人在做在看大语言模型的方向 。
所以我感觉那会儿它就是在要去追这个技术 ,以及它在要调整一些思路吧 。
因为我当时看这个标题 , 看到这个文章的时候 , 我觉得还挺感触的 。 中国的大象可以跳舞 ,是有一本书叫 《 谁说大象不能跳舞 》,是它其实讲的是 IBM, 就是 IBM 当年怎么转型的一个故事 。
它有一个可能有点类似的一个故事 , 就是 IBM 当时让这个大象跳舞的那个人叫郭士纳 ,他是一个外来的人, 然后他是顶住了特别多的压力 , 然后在 IBM 内部做了一个调整 。
我原来还做记者的时候 , 就是有去采访当时 IBM 中国的一个研发的一个负责人, 然后他讲到另外一个点是说 , 这个 IBM 它有两个原则 ,其实后来华为它有跟 IBM 有 , 应该是跟 IBM, 如果我没记错的话 , 就是它就是学那个 IBM 的那一套方法 , 里面有两点 , 就是当然华为就是一直在强调客户至上嘛 ,IBM 就是一直在把客户至上放在最重要的位置吧 。
另外一点是他们非常的重视自己的这个研发中心 。 然后当时我记得那个人有跟我讲过一句话 ,他就说因为重视研发 ,因为重视客户 , 可以让你一直知道市场上在发生什么 。他就说除了这个组织管理上的一些灵活 , 最重要的其实是这个 。
所以就是我当时看到你们的写的这个点 , 我就写了这个问题 , 就是根据你们的了解跟采访 , 除了是资源上的一些优势 , 字节做了哪些事情在今天回头看是对的 , 让它获得了今天的这个局面 。
对 , 我觉得正好这个时间线也是接着上一个问题 , 就是说那 23 年可能从下半年开始嘛 ,他们就会有一些变化 , 然后才会到今年你会逐渐的看到一些结果 , 对吧 ?
我觉得一个就是一号位对这个事情的重视 , 这个事其实也是贡献了中国的大象会跳舞的这个比喻的这个投资人, 我们跟他聊的时候有一个启发 。
一个是创始人就是张宁自己 , 我觉得他从去年底开始对这个事更重视 , 或者说他更亲力亲为的参与了吧 。
那比较直接的一个变化确实就是他在广泛的去建这个领域最好的一些研究者 ,他在自己去招募团队 。 然后也是这个投资人, 我跟他聊的时候 ,他提供了看这个问题的一个视角 , 就是他说一个大公司在某一个阶段的动作其实也确实跟这个创始人, 如果一代创始人他还在还有影响力的话的人生阶段是非常相关的 。其实张宁确实很年轻嘛 ,他是 1983 年的 。
我们也可以看一下就是这些互联网移动互联网公司创始人的人生阶段 , 比如说腾讯大家也觉得他的排面很好 , 那马化腾确实是可能他年纪更大一点 , 对吧 ?
他是 1971 年的 ,他比张宁大个 10 岁 。 那再往前的话 , 像马云是 64 年的 , 李彦宏是 68 年的 , 扎克伯格当然非常年轻 ,他比张宁还小一岁 ,他是 84 的 , 然后 Sam Altman 是 85 年的 。
你就会发现一个非常诡异的事 , 就是六小龙的创始人里只有两个比张宁年轻 ,89 年的闫俊杰和 93 的杨植麟 。
当然年龄和人生阶段并不代表一切 , 我觉得只是观察这个事情的一个视角 , 就是张宁现在确实你可以说他还有很强的这个去学习去折腾的这个潜力 , 对吧 ?
然后具体到就是当他自己开始特别重视这件事情之后 ,他具体做了什么 ,其实也就是我刚刚讲到的 ,他花的很大的精力就是招人嘛 。
张宁自己以前表达过创业最重要的一个就是你对这个事情有个判断和认知 , 二就是你找到最合适的人和团队 , 那剩下大部分问题其实可以被这两件事解决 。他去招人这个事 , 我后来发现我们跟闫俊杰聊的时候 , 我觉得闫俊杰对这个事情可能他有一个判断是类似的 , 那我们应该是 3 月的时候采访的 , 然后当时我们有聊到字节 , 闫俊杰就说他
觉得对字节来说最重要的就是技术资源 ,因为他的产品上的能力都是 ready 的 ,而且他的产品资源是等于无限多的 , 去做很多很多尝试 , 然后他最重要的就是把技术给怼上来 , 对吧 ?
那后来我觉得字节确实在招人上 ,在做研发上他是在做这个动作 。 然后还有一个比较重要的事就是 23 年 6 月之后, 我觉得字节它更明确了一个策略或者说思路吧 , 就是它要自己来做大模型和产品 ,不再对外投资中国的大模型公司 。其实在 23 年 6 月之前 ,他们应该是考虑过投资两个公司 , 一个是阶跃星辰 , 一个是 MiniMax。
阶跃星辰这个是我了解的话应该是相对比较确定已经走到比较后的流程了 ,但它最后还是没有投 。
总之没有投之后, 我觉得也让内部可能有一个更明确的共识吧 , 反正我们就是自己做好这件事 , 对吧 ?
第三件我觉得它做的比较重要的事就是 Flow 这个部门和这个团队的建立 ,而且整个集团应该也确实给了这个部门很多的支持和资源 。
那它有了这个部门之后, 基本上我觉得它在做的那件事跟闫俊杰描述的很像 , 就是我的技术能力要上来 , 然后我试很多很多的产品 , 比如说我们可以看到它有豆包 ,有扣子 ,有新会有猫香 , 还有什么豆包爱学 , 这个以前其实是字节教育的产品给他拿过来的 。
然后包括猫香之前也是抖音那边的产品 ,是番茄小说的产品 , 就它都汇聚到这了 。 当然现在其实除了 Flow 之外, 字节的别的一些团队也有在做这个 AI 了 , 可能大公司就会有这种情况吧 。
我们那个文章的后面也提到说大公司可能会给创业公司的一个机会就是一个事 , 如果它投入一段时间没有特别明显的反馈 , 大的组织里其实可能是会有很多张力的 , 比如说团队之间的一些拉扯 , 对吧 ?
然后比如这个战略重点的一些变化 。 那说到这个 ,其实最近有个好玩的事 , 就是字节不是要去告一个实习生让他赔 800 万吗 ?
然后最开始那个传闻出来的时候 , 我不知道你们看到过没 , 说那个实习生为什么要蓄意的去搞破坏 , 就是因为他不满于他所在的这个项目没有得到足够多的 GPU 的支持 。
当然我不知道这件事情是不是完全真实的 , 我只能说最开始你看到流传的版本是这样 。 然后这个人他就是不是在 SEED 的团队的 , 就是他不是在那个朱文嘉管的那个就是大模型的研发团队 ,他是在字节的商业化技术团队的 , 就是在刘晓斌下面的 。
就其实字节好多部门都在做 AI 相关的一些尝试 。
那从这个报道里面看到 , 感觉字节是非常强大 , 甚至就是强到让人有点害怕的 。 那它没有什么弱点吗 ?
字节其实它还有一个外部的变量 , 我们文章里并没有特别展开 , 就是它已经是一个家大业大的公司 , 对吧 ?
然后 TikTok 在出海 ,在美国其实有些压力的 , 所以接下来就是海外的这个压力对它怎么做 AI 的力度和方式可能会有些影响吧 。
因为字节现在很多产品也是出海的 , 当然它出海的有些产品他们自己说其实我背后用的并不是我们自己的模型 , 它可能用的是 OpenAI, 用的是世界上其他一些公司开发的模型 。
阿里云局1:01:19
这个在聊字节的同时 ,其实还有另外一个我觉得也非常值得聊的大公司 , 就是阿里 。 那它不但在投资上面非常激进 , 那其实它自己的这个千问大模型也很牛叉 。
可不可以也这个请曼琪讲一讲 , 就是你对阿里在做什么 ,有没有一些采访到的对你留下深刻印象的一些观察 、 故事 、 信息等等 ?
我觉得阿里云从去年 9 月开始 , 我记得感觉你可以说它焕然一新也不为过吧 。 因为在那之前的一年里面 , 拆成 1+6+n, 它有很多的这个组织结构上的调整 , 云里面其实也一直在调整 , 就大家老觉得在调整 。
但是去年 9 月吴永明他开始做这个云的 CEO 之后 ,他是定了一个新的方向嘛 , 叫 AI 驱动公共云优先 。
我觉得在那之后其实阿里云的战略就是这几个字是可以概括得很好的 。 我们去年 10 月也采访了阿里云的 CTO 周静仁 , 这篇文章我也可以贴到 show notes 里面 , 这个是在晚点发的 。
然后我觉得他就是比较清楚的讲了阿里云是怎么看待 AI 这个机会的吧 。 我觉得阿里云最想做的就是新的智能时代的计算的基础设施 , 那这个首先在算力层就是 Ice 层 , 那可能就是我大规模的这种 GPU 的集群 。
然后再往上的话是模型服务层 ,他们叫 MOS, 就是模型级服务 , 这个包括模型的搭建工具啊 , 调优工具 , 还有他们也在搞社区什么的 ,他们有一个摩搭的生态 , 这个我不知道 Koji 用过没有 , 反正就是你可以在上面下很多模型 。他们还有模型本身 ,也就是通义开源系列这个部分 。
然后它的开源确实我觉得不管是行业口碑还是热度关注度都挺高的 。他们自己披露的数据的话 , 到今年 9 月 , 通义的开源系列应该是已经被下载了 4000 多万次 , 然后衍生了 5 万多个模型 , 这个数字是仅次于 Meta 的 Llama 系列的 , 就在全球的影响力也非常大 。
所以我觉得它就是想把云这个做好 。
对 , 就还是挺受关注的 。在外网上这个 X 上其实大家搜的话 ,其实可以看到挺多对他们的评论 ,而且是有挺多我觉得是 KOL 的一些评价的 。
然后我们今天开场的时候 ,Koji 不是还总结说这个是字节和阿里的代理人的战争 , 对吧 ? 就说阿里投了这个公司 。
我们自己文章里倒是没有用这个词 , 我看到是蓝曦他在极客上发的一个总结里面 ,他用到了这个词 , 我觉得挺有意思的 。
如果你说现在的这个竞争是代理人战争的话 , 那我觉得未来这个市场确实可能有一个看点 , 就是说火山云和阿里云之间会不会有一些竞争吧 。
然后我看到周亚辉发的朋友圈里面 ,他也提到了这个 。 我们那个文章里也引用他这条朋友圈 ,他朋友圈很长 , 我们可能只引用了他关于字节前面的就表现的评价的部分 。他后面其实写到说他年初的时候跟阿里云的高管聊过 , 说他觉得字节的大模型的 API 是一定会猛干的 ,而且会想办法让一些厂商必须用他们的 API, 这是火山云崛起的关键 。
然后他说阿里的那个高管不太信 ,但是他认为这是字节未来会发展的一个方向 。 然后关于这个阿里云和火山云的情况 ,其实我去年到今年也有和阿里的一些朋友沟通 , 反正我的感受是阿里云还是很自信的 。
因为 23 年初的时候 , 火山云的算力的升势一度是很火的 , 我不知道你们还有没有印象 ,他们还开发布会说什么中国多少大模型公司都是用我们的算力 , 然后百分之多少的这个模型是在我们这里训练的 。
然后到今年的话 , 感觉它的这个升势就稍微弱了一点嘛 。 然后阿里的人的解释就是说 23 年初为什么火山云那会特别火 ,是因为当时字节确实是 GPU 的储备比较多 , 然后而且那会大家主要就是要买这个训练用的模型 ,因为要的又比较急嘛 , 所以一下子它这个量起的比较多 。
不过这个市场再往后发展的话 , 你真正对算力需求的大头其实是在推理上, 然后推理的话对数据中心的数量 , 包括你的区域的分布的广度 , 你的稳定性 、 弹性计算的能力的要求都会多很多 。
然后阿里云的人会认为 , 就是一旦进入这种正规军的比赛 , 火山云不要说跟阿里云比 , 你可能和腾讯和华为都很难比 ,他们当然觉得自己是最好的 。
阿里云却在这个基础设施本身的稳定性啊 、 工程细节上 ,他们也积累了很多年 。 而且 o1 这个方向出来之后, 本来那个大家就会把 o1 的这个转变有一个总结 , 就是说你从这个 a pre-train 到 a poster train, 对吧 ?
你是 inference scaling law, 就是你是推理阶段的这个规模扩张 , 就本身你可能推理阶段的算力需求也会上升 。
我觉得未来火山云和阿里云之间怎么变化 , 这会是一个看点吧 。
其实周亚辉朋友圈里面还说到 ,他是认为字节一定会学 Google 和亚马逊的 , 就一方面现在要把厂商的广告费用吃下来 , 另一方面还会去吃掉他们的云的费用 。
所以这个字节云的市场份额慢慢的逐渐的一定会等同于字节的广告市场份额 。 那曼琪除了字节和阿里 , 你感觉其他大厂还有谁在牌桌上吗 ?
我觉得腾讯应该算吧 , 反正大家可能会认为腾讯它想后发制人, 对吧 ? 它敢为天下后, 它也能为天下后, 它什么时候上牌桌它都能有上牌桌的入场券 ,因为它确实有超级 APP 在手里 , 然后它也有非常多的流量 。
微信的流量等于是免费的 , 对不对 ? 可以这么说吧 。 就是我发现就是说你去观察一个什么类型的产品或一个什么公司 , 它成为了一种基础设施 。
一个很好玩的地方就是你用什么东西去关联你的新的注册 , 比如说我在海外, 我如果要去注册一个新产品 , 那我肯定就是用我谷歌账号 , 对吧 ?
我所有东西我都可以用谷歌账号去注册去登录 。 那在国内的话 , 那就是包括 Kimi 啊 , 包括这些新的产品 , 我基本上就都是用微信 , 我就一键登录了 。
就它已经像水和空气一样 , 就只要你在这个互联网世界 。
你的互联网通行证 。
对对对 , 你的互联网通行证 。 所以我觉得腾讯肯定它算是想上牌桌的时候是可以的吧 。 我甚至想好了 , 我之后我们写到这个事 , 可以有一个标题 , 至少是个小标题 , 叫 " 字节补铲 , 腾讯在后 "。
所以腾讯是螳螂 , 字节是大象 。 那与此同时, 你观察到百度在做什么呢 ?
你观察到百度在做什么 ?
今年百度世界大会的主题叫 " 应用来了 ", 然后李彦宏在里面 ,他跟那个贾子根和郭星燃不是有一个专访 , 然后那个专访里面讲的话是 , 相比超级应用 , 更重要的是不断赋能数百万超级有用的应用 。
我对百度在大模型上的具体的进展 , 今年我觉得明显会比去年的信息要少很多 。 然后我们这个文章里倒是写到一些百度的情况 , 就他们在组织上现在确实比较复杂 。
比如说这个文章里写到就是在百度 , 它训练基础大模型的团队 , 和用这个基础大模型去开发 2C 大模型产品的团队 , 和用这个基础大模型去提供 2B 大模型方案的团队 , 它是在三个不同的事业群里的 。
它也不是三个部门 , 它是三个事业群里 。 然后这个跨部门的这种协作啊 , 沟通就会比较麻烦 。
所以之前为什么有人传说那个百度暂停预训练啊 , 什么什么 , 它有一个原因是因为 , 比如说这个训练的团队想去调更多 GPU 的时候 , 就有可能会遇到你资源不太那么好拿的情况 。
因为你同样的算力 , 如果你放在这个 2B 的业务上, 它可能就是有收入的嘛 。 那如果你又把它重新投入去训练一个新的模型 ,也是因为现在这个训练模型本身的性能提升可能没有那么明显 , 就这个回报就会变得不确定 。
所以我觉得百度这个公司真的挺神奇的 , 就一方面确实也挺技术驱动了 , 它也有一些挺有技术前瞻性的东西 , 包括我们刚才也聊到说在中国的公司里面 , 最早做大模型的公开来看也是百度嘛 , 它 2019 年就发布了一个大模型 ,而且它曾经有真的很多很厉害的人, 像温达之前也在百度 , 对吧 ?
还有 xAI 的最开始那 12 个成员里面 ,有一个叫杨格的 ,他以前好像也是在百度实习的 , 包括那个 Anthropic 这个 Dario,他不是也是在百度实习了一段时间吗 ?
他曾经还是一个 AI 人才的技术高地 ,也许跟他投入的太早 , 然后他又很难坚持一个事有关吧 。 但另一方面 , 我觉得百度今年可能在 AI 领域更受关注的事情是它 Robotaxi 上的一些进展 。
今年 6 月萝卜快跑这个事还是非常出圈的 , 甚至我觉得都算是社会新闻了 , 就大家还是非常关注的 。
而且我还专门去看了武汉的市民留言板 , 就挺有意思的 。 就是对普通人来说 , 那个留言板里的不管是吐槽还是期待说你赶快到我家附近去开一个这个萝卜快跑的点 , 对吧 ?
就里面没有任何一个人说用 Robotaxi 这个词 , 就可能只有在媒体和投资圈才出现这个词 。 而且比较好玩的就是 23 年底的时候 , 那个留言板上有很多消息都是说在这个规划里面 ,不是说要在我家附近哪哪哪要开一个点吗 ?
怎么还不开点 ? 都是在问什么时候开点的 。 总之是它前面的留言都是期待说你到我这来开个点 , 后面的留言都是一些吐槽 , 比如说它怎么阻塞交通了呀 , 又或者它怎么那个霸占着加油站 , 让我们这些居民加不了油啊什么 。
这个我觉得也挺有意思的 。
那其实我老家是重庆永川区嘛 ,其实永川市在 2021 年百度就开始去布萝卜快跑的一个地方 , 那个是仅次于北上广的一个试点的区域 。
对 , 所以我的老乡们是非常早就体验到了萝卜快跑 。 我感觉到的口碑在今年 6 月份那个社会新闻发酵之前 , 真的都还是不错的 , 就是很多人觉得很方便 ,也在呼吁说是不是可以赶紧到我家附近来开 。
对 , 我觉得这个倒是它坚持这么多年, 好像看到有一点变化的一个东西 。
应用生态1:11:09
我们聊完大厂之后, 我们再来聊一些这个最近的感受 。 一个是上周日, 其实十字路口在北京办了一场活动 , 然后那场活动其实曼琪也来了现场 , 我们非常非常的惊讶 。
这个活动的通知发出去之后, 我们 48 小时的时间把报名了 776 人, 然后最后因为那个活动现场在北京大学校园里面的一个斯坦福中心的一个空间 , 所以它只能装 200 来人。
所以我们到最后这个也只能这个容纳 200 人, 就有很多朋友都非常遗憾没能到现场来 。 但是在现场我觉得那个真的是就是感受到了巨大的能量 , 就是大家都超级的毅人, 就感觉充满了希望吧 ,有那么一种感受 。
然后这个在现场我观察到 ,其实多数人都是做应用的 , 这是第一 。 然后第二个呢 ,是我觉得至少有肯定超过三分之一 ,有没有一半不好说 , 都是在做出海的应用的 。
去了那个活动的感受就是 , 我们应该多采访 AI 应用创业者 , 就专门做 AI 应用的 。 就这个是我觉得我们以后应该多聊一些的 ,因为我们之前确实可能是聊大模型公司的人会更多一些 ,他们的处境确实很不一样 。
因为比如说我在现场我遇到的很多人 ,其实他们还不是一个全职创业的阶段 ,有的人是他们想去找创业的方向 , 然后有的人是他现在可能还在一个大公司里 ,但是他在兼职的做一些事情 。
所以这完全是和典型的由 VC 支持的那种 go big or go home, 如果我不做大我和死了没有区别的这种创业 , 它是完全不一样的逻辑 。
那我觉得他们有些人很多人都是没有融资的 , 我在现场聊了一些人 ,他们就用自己的钱 , 或者说我这个产品上线之后我很快就有现金流 , 我就有收入 , 它是用这种方式来运转的 。
所以我觉得他们就是一种轻装上阵的状态 。
对 , 这个是一个非常大的今年的趋势吧 , 就是一个是 AI 来了之后超级个体 , 或者这个很小规模的团队 , 就是可以做出在过去需要融个 100 万美金才能干的事情 , 就需要的启动资金变少了 。
然后第二个变化是 AI 来了之后, 大家 day one 就可以收上钱 ,是吧 ? 因为为 AI 产品付费在至少海外市场吧 ,是特别天经地义的 。
然后第三是 AI 来了之后, 中国的创业者更容易做全球市场了 。在过去可能都还有语言的障碍 , 这里面大家甚至会有一些害怕 ,但是在今天就是语言根本就不是问题 。
而且其实前面也有很多的搒样 , 就是像莫妮卡的小红也说她的英语这个四级虽然考过了 ,但其实非常渣 ,也不妨碍她成为一个在全球做得很优秀的企业 。
我觉得这种种的原因加在一起 , 就是让今天有更多选择不融资 , 选择用自己 bootstrap 的方式去创业的应用的开发者 。
我当时看晚点这个报道的时候 , 会觉得中国的创业者真是艰难啊 , 就是前有这个封锁 , 后有这个这么激烈的竞争 , 然后大家都是这么努力的人。
我们本来就是从小被教育的又都这么努力 , 然后在这样子的竞争环境下就是面临着 , 我觉得其实是每一个人, 不管是大模型还是应用创业者 ,其实大家都是在同一件事上选了不同的方向 。
做这些探讨吧 ,其实还是都是希望这个方向大家都好 。
对 , 我觉得它就是对你很难说谁好谁不好 , 它就是逻辑不一样 。 比如说这些比较小的团队 , 它确实也可能会遇到一个问题 , 就我做了一个产品 , 这个产品的需求也许就是个一波流的需求 。
就比如这一两个月它特别火 , 可能之后就没有人用 , 它不是一个持续性的事情 , 它不是一个事业 ,也有很有可能是这样的情况 。
对 ,而且其实热火朝天 ,其实 AI 应用也面临着一个问题 ,因为大家都说本来期待 2024 年也是 AI 应用爆发年嘛 , 到年底大家好像又会觉得又有很多声音会说感觉好像没有爆发 。
Koji 你觉得什么地方爆发了吗 ? 比如说 AI 编程这种算是一个小小的爆发吗 ?AI 搜索算吗 ?
我反正说到这个我其实还是有点情绪的 , 就我觉得大家真的对这个事情的预期太高太高太高了 , 就觉得好像明天就中国又要出现第二个字节跳动 。
但如果是这样的一个预期的话 , 那注定是失望的 。 但是我们自己在一线 ,不管是做这个播客 , 还是我们自己也做项目 , 然后身边的朋友们都在做类似的事情 , 就我感觉到的是非常的雨后春笋 , 就是我觉得很有希望 ,有非常多新的东西在不断的冒出来 。
我觉得人家是应接不暇的 , 那有些是中国人做的 ,而且非常多是中国人做的 。 那比如说最近我觉得我自己这个就很感慨 , 一个是 Recraft, 就我用完它的交互之后觉得我靠 , 就这种感觉 , 就是 Photoshop 就感觉像上个时代的东西了 。
就是如果我的小孩要开始用电脑去做图像编辑 , 我 day one 一定是会 ,不是我教他 , 可能他受到的这个整个教育 , 或者他的朋友们 , 就一定是从 Recraft 这样的交互开始的 , 多么的自然 , 就符合人类的这种更容易更轻松去操作一个图像的那样的习惯 。
可以讲一下这个吗 ? 就是它是电脑端用的吗 ? 还是在手机上 ? 还是 ?
在电脑端用的 。 就它首先是一张无线画布 , 然后它可以纹身图 , 然后它也可以针对图片去做局部的调整 。
看上去呢 , 就这些东西可能在早年有 WebUI 或者有 ComfyUI 的时候都可以做到 ,但是这个 WebUI、ComfyUI 其实它是让普通人是望而却步的 , 那个学习门槛是巨高的 。
打开 WebUI 看到 100 个英文参数 , 就是是个人都懵逼了 。 但是这个 Recraft 不但自己模型能力做得好 , 把交互也做得非常好 。
就我自己认为 , 或者我观察到吧 , 就小红书上的这些网友们也都用得很轻松 , 就上手了 , 最后做出来的这个不管是质量还是创造力都非常好 。
再说这个 Cursor, 就你用的第一天就是有初恋的感觉 , 然后我记得那一天是我们在十字路口有一个 Fellowship 的每周日的一个大家聊天的一个线上会 , 然后在那个会上呢 , 就有一个 00 后的范涵 , 就我们的 Fellow 之一 ,他就讲说他用了 Cursor 之后认为从此以后编程的学习门槛不再是编程 ,而是克服自己的恐惧心理 。
然后我听了这句话之后就真的被打动了 , 然后我当天就那个会还在进行的过程中, 我就下载了 Cursor 开始这个用起来 , 就是 10 分钟就写出了第一个 demo, 就是我输入一段随便什么样的自然语言 , 它翻译出一段 emoji 来表达我的这段自然语言 。
就我觉得这些都是很大的变化 。 然后还有一些啊 , 就是我看到中国很多独立开发者 , 我们之前在十字路口有一期内容叫那些闷声发大财的在海外赚钱的 AI 应用 , 我们在那里面列举了十几二十个 , 这里头都是中国人做的 。
而且我们因为做完那一期之后又有不断的朋友告诉我说 , 哎 , 你们做漏了这个 , 做漏了那个 , 就漏得越来越多 。
就看到有很多是低调的 ,他不需要 PR,他也没有理由去 PR,因为他不融资 ,他也不面向中国的开发者 ,他也不面向中国的用户 。
所以他就只需要很少的人, 所以他都不需要去做 PR 招聘 , 就团队十几个人。 我感觉这个在应用领域 , 像我们办一场活动来 776 人报名 , 就想上台去分享的 , 报名开放麦的都有 70 多人。
我感觉这里面的生态是很繁荣的 , 很多人在这里头看到了机会 , 甚至已经就是得到了一些正反馈 。
这个挺有意思的 。 我觉得确实这也是接下来市场里 , 就除了大公司和我们能看到的最头部的又做模型又做应用公司的这些公司之间的变化博弈之外, 就应用怎么产生会很有意思 。
不是有一个荣晖喜欢说的说法 , 就是说什么 。
当年颠覆雅虎的不是它的一个同类是 Google, 后来对 Google 有挑战的也不是一个搜索引擎 ,而是 Meta。 日后看来对你最有威胁的一个竞争对手都不是在今天能看见的 。
这个也是最可怕的一件事 。
而且我们今天聊的比较多的都是 AI 软件嘛 , 对吧 ? 不管是大模型还是刚才说的一些应用都是软件 ,其实现在软件和硬件结合 , 包括做一些新的类型的 AI 硬件的创业的尝试也挺多的 。
曼琪做完这个稿子 , 你自己对这几家大模型的创业公司有什么整体的感受吗 ? 你会觉得大家在努力的找出路 , 或者说大家其实整体有一种强撑的感觉 , 或者是内部的情绪是很悲观的 , 还是是刚才说到的这些的相反面 ?
我觉得他们肯定是在努力的寻找出路的 , 至少在创始人这个层面 , 我觉得创始人没有空悲观 。 我觉得比较理想的或者比较典型的创始人的画像 ,他可能会很激进 , 就是他对危险是很敏感的 ,但这个危险也许带来的更多的是你要去行动 , 你要去反应 , 你要去谋划 。他可能更多是兴奋感而不是恐惧感 。
你一最开始会去创业 ,而且你会选就是我要去做这种很大的东西 , 我要去搞大事情的这种创业方向的人 ,他本身的冒险偏好和成就动机都是比较大的 。
我觉得可以观察一下大家要会去找什么样的出路 , 包括除了技术和产品之外 ,其实肯定有一些公司也想更早的上市嘛 。
就你在商业上, 包括你的融资渠道上是不是能有一些变化 , 我觉得大家都会有很多思考和要去尝试的方向 。
所以我觉得就是这个故事肯定还没有到结束的时候 , 这个对我们这种观察者当然是一个好消息 , 对吧 ?
你可以继续去看未来会发生什么 。 然后我也很期待会有不一样的翻转的叙事出现 。
其实就像晚点稿子里面提到啊 , 就是又引用了王兴的其中一句话 , 叫做大多数人都以为战争是由拼搏组成的 ,但其实战争呢是由等待和煎熬组成的 。
就新歌这个虽然现在已经不玩泛否了 ,但是他曾经在泛否上发过的各种各样的句子 ,在今天仍然时不时的冒出来 , 觉得哇哦 。
对 ,而且我从后台看到的数据的话 ,他这一句话应该是被划线次数最多的 。他这句话好像是划线 70 多次吧 , 就他非常犀利和精辟的总结了一个现象 。
等待熬煮1:21:22
好吧 , 那我们今天就聊到这里 , 谢谢曼琪 。 那也希望大模型这场战争再往前 , 相信大家还会有很多的等待 , 很多的煎熬 。
那在这个过程当中呢 , 希望大家能够就是比较俗套的一句话吧 , 就享受这个过程 , 过程本身即是奖励 。
谢谢十字路口的邀请 , 感谢串台的机会 , 各位拜拜 。
拜拜 。
拜拜 。
如果你认为有朋友也会喜欢本期十字路口的内容 , 请转发微信推荐给他们 。 最后欢迎你加入十字路口的会员群 , 我们会在群里每天放送 AI 全球新闻 ,并且鼓励大家在群里聊天互动交朋友 , 寻找未来的同路人。






