开场0:00
欢迎收听 《 十字路口 》, 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会 。 十字路口是乔布斯对苹果公司的一个比喻 , 形容它站在科技与人文的十字路口 , 伟大的产品往往诞生在这里 。AI 正在给各行各业带来改变 , 我们寻找 、 访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者 , 和他们一起探索和拥抱新变化 、 新的可能性
。
我是 《 十字路口 》 的 Koji, 联合创办了街旁 、 新世相和躺岛 , 发起了 AI Hacker House 这个新一代 AI 创业者的社群空间 。
我相信科技 , 尤其是 AI,是我们这一代人最大的价值创造机遇 。 欢迎大家找我聊天 , 碰撞想法 , 链接下一个可能性 。
我是 《 十字路口 》 的 Ronghui,在美元 VC 工作过 ,也做过 5 年的硅谷驻站记者 , 关注科技发展和商业故事 ,也欢迎大家找我聊天和我交流
。
本周 《 十字路口 》 的嘉宾是晨然 , 晨然所在的团队叫 ONE2X,他们这几天刚发布了一款 AI 视频编辑产品 , 叫做 Medeo。Medeo 呢 ,有小型刷屏 , 获得了蛮多的很好的评价 。
我认识晨然有一年多的时间 ,在这一年里面 , 看着他从一个产品经理成长到现在 , 就非常称得上是一个超级个体 。
从当时自己手搓一些小 Demo, 到现在可以独立地 hold 住一个高复杂度的 AI 项目 。 我从他身上看到了好像这个竹笋般的生长的速度和生命力 ,也比较像是十字路口一直在倡导的 , 叫做做 AI 时代的积极行动者这样一位典型的代表 。
那在今天的播客里面 , 我们会和晨然聊两个部分的内容 , 一个是 Medeo 这一款产品 , 为什么在基站的 AI 视频赛道 , 它们刚发布的新产品还是冲出了一条不错的新路 。
第二呢 ,是晨然的个人成长 ,AI 给这代年轻人带来的机会要如何抓住 。 好 , 我们先来进行一下快问快答的环节 。
首先请问晨然的年龄 ?
25。
毕业院校 ?
在复旦读的本科计算机 , 然后在 Cornell 读的研究生计算机 。
在 Medeo 之前你做过一些什么 ?
在大厂做了 9 个月不到就来了 ONE2X。在这之前做过很多大大小小的全站的 project, 包括跟新世相合作的 AI 遗嘱项目 , 包括自己测了一些跟 Agent 相关的小的项目 。
对 , 我和晨然还一块做过一个叫 AI 遗嘱的项目 , 晚一点我们可以展开聊一聊 。 然后晨然的 MBTI 核心座是什么 ?
ENFP, 双子座 。
如果你要用一句话安利 Medeo 这款产品的话 , 你会怎么安利 ?
它是一款小白到专业用户都可以用一句话来生成一个专业的视频的 AI 工作室 。
在 Medeo 目前生成的视频里面 , 晨然你目前看到最大的一个爆款是什么 ?
没有什么爆款 , 我感觉还是比较早期的 。 但是有一个我非常喜欢的是 , 我在推特上面放了关于 Medeo 的一个自述的一个故事 , 然后他直接把这个故事转成了一个视频 ,并且还 @ 了我 。
我觉得还蛮有意思 , 我没有想到他会把我的故事转成一个视频 。
好的 , 回头我们会在播客的 show notes 里面放这个视频的链接 , 然后也辛苦晨然到时候帮我们精选几个其他的视频链接放到这个播客 show notes 里面给大家参考 。
对 , 上次我见到晨然是在 AI Hacker House 差不多一周之前吧 , 然后那一天是有一个发布会 ,是 Flowhead 在发布他们的新的 Agent 的产品 , 叫 Neo。其实晨然那个时候差不多是同期也在发布 Medeo, 然后发了之后服务器就爆了 , 然后晨然他们应该搞了一个通宵 。
发布反响3:35
但是那之后你还是决定来 AI Hacker House, 想来看一看 Agent Neo 的那一场发布会 。 所以其实比较好奇想问晨然的第一个问题 , 就这一周发布到现在 , 你应该收到了非常多来自朋友们的 、 来自用户们的一些反馈 , 你现在整体的感受怎么样 , 对这一次发布 ?
我感觉这次发布对我来说没有特别大的实感 ,因为虽然是我们正式的 launch,但是也是规划了蛮久的 。 我感觉这件事情只是完成了 。
但是比较令我欣喜的是 ,有一些用户反馈我们说我们的产品的功能区域的划分想得比较清楚 , 我感觉还是没有白费之前几个月的那个很大的重构 。
这个它得到的这种反馈或者用户的这个传播的程度和你的预期是一样的吗 ? 还是比你想的这个来得更热烈 ?
其实我们这次都没有一个非常明确的需要在传播上完成的指标 ,因为我觉得我们这次发布更多的是一次非常雏形的尝试 , 然后在节奏上希望现在在这个时间节点还是发出来吧 。
所以在传播上我们本身就没有特别大的预期 ,以至于其实后来看到还是有一些公众号啊 , 还有一些 KOL 在转发 , 我觉得还是比较欣慰的 ,因为还是比较超出预期的 , 说实话 。
现在大家在发这个新的 AI 产品的时候 , 都会比如说做一场发布会 , 然后会发邀请码 , 然后会请 KOL 来做一些造势 。
然后听起来这个 Medeo 好像在这个部分没有特别的去把它当作一个发布 campaign 来做 , 这背后是出于什么考虑呢 ?
一个是我觉得本身做一款 AI 产品需要花的时间本来就比较长 ,其实说实话我们到现在为止也没有做特别长的时间 。
我认为工具产品本身就需要花到一年来算 , 来打磨这个产品的所有细节 。 现在还是一个比较早期的阶段 , 我认为现在去正式发布一款完成度比较高的产品也很难这么说 。
然后第二个是我们公司的特点吧 , 本身我们不是一个想要博流量 , 然后在造势上就是跟其他产品进行一个很直接的竞争 。
我们更希望就是也比较为所发育 , 可能就是想要慢慢的把这个产品打磨上去 , 然后积攒一些用户口碑 ,而不是现阶段非常明确的关注 DAU 这些指标 。
视频之选6:20
为什么当初要选择做 Medeo 这一款产品 ?
我先讲我是怎么加入 ONE2X 的吧 ,是最早的时候 ONE2X 是由王冠 、 姚行还有一位技术联创一起成立的 。 王冠是之前 Kimi 的产品的负责人, 然后他当时负责 Kimi 的模型训练的效果 。
当时他特别想做应用层 , 然后跟我聊到了 AI 视频这个应用层的赛道 。 而我自己的有一些背景是比较交叉的 ,因为我自己既是程序员 ,也是一个内容创作者 , 做过导演之类的事情 , 我就特别想要结合我的自身的两个特性 , 一个内容创作 , 一个是技术开发 。
然后我觉得 AI 视频正好就能把我这两个特质发挥到最大 , 所以我特别特别希望在这个赛道上能做出一款属于我的工具类产品 。
然后 Medeo 为什么是现在开始做 , 一个是视频越来越成熟 , 我们发现像生成视频类已经有特别特别多的玩法 。
像去年其实我们还判断这个东西因为成本还有它的稳定性问题 , 没有办法做出一款完全自动生成的视频 。
但说实话我们中间有 pivot 过 , 就是看到了现在市面上的生成的视频的玩法越来越多 , 我们觉得这个速度可能已经快到了 , 那差不多也就是时机能够做自动一键生成的视频 。其实一开始我们 Medeo 定位的方向还是做视频剪辑 ,其实现在也算是视频剪辑 。
我们强调的是一个端到端的生成一个可交付的视频 , 然后并且你还可以在工程文件上继续修改 ,而不是说在乎它一定是生成的还是剪辑的 , 两个方向我们都会尝试 。
而是在很多方向中选了这个 , 还是说一开始就想得很清楚是它 ?
一开始想得很清楚一定要是做视频 ,因为我们判断视频的经济 , 只要有模态的升维 , 把文字或者是语音的各种信息以视频的方式表达出来 , 它是有更高的经济效益 , 能够很快的拿到一个经济结果的 。
而且我们觉得现代人本身看视频的习惯也是越来越大 ,其实大家可能看一篇公众号的文字 , 那他也肯定会看得进去这篇公众号的视频版本 。
所以我们判断的是有这样一个先验的一个认知吧 。 然后选了视频赛道之后 ,但是视频也很宽广 , 最开始我们就想选的是一个自动剪辑 , 就是 URL 转视频的这个赛道 , 就是一篇文章 , 它有图文 , 然后把这个东西转成一个自动剪辑的生成视频 。
刚刚我说因为看到视频生成的这个技术越来越成熟的情况下, 我们才决定把视频生成 , 一键视频生成作为我们的主打功能 。
但是我觉得这两条路确实不是一个很冲突的东西 , 我们都希望在视频制作上有很多技术的探索 ,但是它中间是生成的还是剪辑的还是检索的 , 我觉得都可以 。
因为只要观众能买单 , 观众能够看得下去是一个好的视频 , 我觉得它怎么制作怎么加工 , 这个是由 Medeo 背后的 AI 去搞定的 ,而不是用户需要关心的 。
你刚说到当时对这个经济效益的考虑 , 可以具体说说吗 ? 就是对这个方向的 , 应该说是商业价值吧 , 就是你们当时具体有哪些可以说的一些测算或者是一些估量 ?
OK, 我们当时其实做了一些实验 , 我们就把一些文章把它转成一个视频 , 然后我们发现这样的视频真的是有人看的 ,而且即便文章可能几百阅读量或者是不是很高的阅读量 ,但是转成视频之后, 一个是转视频成本也不是很高 , 然后转成视频之后发现观众也很爱看 。
就是那个时候看到播放量数据的时候 , 你会有那个体感是感觉到 , 首先视频观众会买单 ,并且视频的信息含量其实没有那么高 , 它反而其实做信息传播的媒介而言 , 它的传播速度更快 ,但是它其实传播信息量不是很高 , 文章是一个信息密度比较高的东西 。
所以我们一直都有一个理念是想要把这些高密度信息的文字信息转成视频 , 做一次升维 。 然后我们也算是小型的 MVP, 验证了这件事情是有价值的 , 就是自己做了一个号嘛 。
自己做了一个什么号 ?
我们做了一个新闻号 , 就专门做 AI 新闻 ,但是是哪个号我就不说了 , 这个还是面向普通用户的 , 可能大家看了会比较傻 。
但是那个时候自己做了之后感觉 , 我觉得这个很难说有一个数据支撑吧 , 就是一个体感吧 。 包括其实现在十字路口也在做视频嘛 , 视频大家爱看 , 就是我觉得模态升维它是有碾压性的一个经济的升维的 。
就是我觉得文字 , 一段文字它含的信息 , 它转成视频之后, 它可能它的单价就会提升十倍 , 我猜测啊 , 这也不是一个验证的东西 。
那一篇文章转视频这个过程中, 应该就是说你们最早在做这个测试的过程中, 我想象一篇文章转视频想起来应该还是蛮容易的 ,但是其实因为我写过脚本 , 所以脚本其实跟一篇文章它的结构非常的不一样 。
可以讲讲你们在比如说最早那个 MVP 从中有学到什么比较有价值的东西吗 ? 就是把一篇文章转成视频 。
其实你刚刚非常敏锐 , 我在做的过程当中, 因为我自己也做过一些导演的经验 ,但我没有做过很多短视频类型的视频 。
我在从文章转视频我就会非常明确的感受到它的逐字稿的脚本和这个视频的语法的脚本 , 它不需要和文章本身进行非常强相关的匹配 , 它有自己的一套的视频语言的表达体系 , 比如说它的 hook 该怎么写啊 , 它的 ending 该怎么写 , 它中间应该怎么提供情绪价值 , 怎么让这个视频让观众看下去 , 它有自己的一套语言体系 。
而反而是文章当中最在乎的那些具有信息价值的信息密度的东西 ,在视频当中很难去体现 , 比如说它的表格 , 它的具体数据 ,因为你一旦把数据念出来 , 观众就不想看了 , 反而是如果你提供一种很干货的那种干货感 , 它比干货更重要 , 就是让观众感觉看了有一些知识收获 , 看了之后有快乐 , 这是视频当中更在乎的语法规则 ,而不是
说文章当中的那些具体的数据 , 那些数据它可能就看一眼就过了 ,而不会真的需要把它念出来 。
那你们遇到有表格的文章的时候怎么处理啊 ?
表格的文章最好是表格本身是一个图片 , 然后能把图片放到视频里面去展示 , 那就 OK 了 。 或者是你做一个比较好看的表格动效 , 我们这个也在尝试 , 就有一些更好的可视化的方式 。
那它是不是要拆成不同的脚本的模板 ?
其实我们没有这么精细的去做 , 还是比较草台的 , 这个没有特别的根据不同品类去做稿子的撰写 。
当然我觉得不同品类本身是需要有可能有不同的模板的 , 它肯定有自己的一套 SOP 嘛 ,但是这个还没做过 。
这个没做是因为没来得及做 , 还是这是某种选择 ? 因为这个选择其实背后也可能意味着相信这个模型的智能之后就自然会把这些事情做好 ,而不需要现在去雕花做 workflow。
一个是最大的原因还是精力不足 , 没那么多时间去搞这种特别特别细致的这种东西 。 然后第二个是我确实相信模型升级之后, 它一定是可以在这种通用任务上 ,不是不叫通用任务上 ,在写稿的各种品类的任务上 ,不需要人特别多的 structure 的一些指导 , 它就能做到 。
我觉得 less structure 确实是非常关键的 ,不能在最开始就上非常重的这种模板匹配啊什么的 , 你有可能限制了模型的发挥 , 把一定的权力放给模型 , 可能效果更好一点 。
这个真的是深有体会 , 就放权 。
工作投入14:30
对 , 刚才你提到这个精力不够来干这个事情 , 那这个在过去一段时间为了打磨 Medeo 这款产品 , 你的精力最多是放在哪里的呢 ?
首先我对外其实是说自己是 Medeo 的产品负责人 ,但其实我主要的工作是在提升视频效果 。 我负责的做的事情大部分是调研和预研 , 会新产生的一些视频领域的可能性 , 比如说 AI 生成视频 , 那它一键生成视频的可能性 , 比如说 AI 自动剪辑 , 那自动剪辑的可能性 。
然后接下来我就会定义它到底什么是新的品类 , 或者说现在的品类是什么 ,在这个品类下的视频 , 它应该如何用 AI 做出来 。
接下来我可能就会手动把它剪出来之后, 开发一些 AI 的 demo, 然后还有一部分工作就是优化出来 , 优化做出来的视频效果 , 比如说 prompt engineer 啊 , 或者是 workflow 或者 agent 相关的事情 。
整个 Medeo 的视频生成的算法都是我搭建的 。 然后我平时花的工作时间 , 可能大家难以想象 , 首先我会花很多时间刷视频 , 我会花很多时间沉浸在抖音和小红书里面的视频 , 还有 YouTube 上面的视频 ,YouTube Shorts 上面的视频 。
因为只有一直沉浸在这种视频的这种 vibe 当中, 你有可能才 get 到它的那个情感到底是怎么传递出来的 。
然后输入视频花了挺长时间 , 然后接下来我就会自己手动去尝试去模仿他们去剪这种视频 ,并且分析他们做视频的步骤 , 沉淀成一个可以被跑起来的代码 。
然后因为我自己是全栈工程师嘛 , 这个视频生成 , 视频的剪辑语法从我这分析完了之后, 也是从我这把它开发出来 。
所以我感觉我是在做两件事情 , 一个是做内容 , 一个是写代码 , 一个是非常理性非常逻辑的就是去梳理这件事情它的结构化的拆解应该是什么样子的 。
然后第二个就是做内容的时候 , 大部分还是比较感性的 , 刷视频的时候我就会比较就是看这些视频能够怎么去传递一个观点 ,他们的节奏感是什么样子的 。
大部分时间是在工作上是在做这些 。
你说你刷了好多短视频 , 然后去感受那个短视频讲故事的那种 vibe 跟怎么表达情感 , 我想先问一下就是你刷的都是哪一类的视频 , 然后短是有多短 ,以及你从中总结他们那个 vibe,他们那种表达情感有什么样子的套路 ?
首先我没有特别特定的去刷 , 就是去我在刷的时候是什么都会刷 , 总结可能是后验的去总结 。 我刷的时候 , 我现在的感觉是抖音上的视频对我来说它的节奏感都非常像 , 几乎是一样的 。
因为它能够在一个串联的这个上滑下滑的这个视频流当中能够生存下来 , 那它基本上都是一样的调性的 。
我一直很想找到这个调性到底应该怎么去用结构化的方式去表达 , 或者说它不应该用结构化的方式去表达 , 这个我还体会不到 ,但是我只是感觉上我情感上能够 get 到这个东西是什么样子 。
它能够带来的意义就是我看到一个视频 , 我能 get 到这个玩意儿会不会在抖音的视频流当中活下来 , 这种判断力感觉是刷出来的 。
然后第二个就是我会定向的刷一些视频 , 比如说 YouTube Shorts 上面的科普视频 , 或者他们的新闻视频 ,他们有一类是一个主播面对一个可能白板或者黑板去讲什么知识概念 , 比如说讲一些宇宙啊什么东西的 。
那个那一类视频我就感觉所有人其实都是一个风格 , 基本上就一个风格 ,他们可能会带有自己的口音和节奏什么的 ,但是既然它是一种风格 , 那我相信它就可以被结构化 。
这类视频它给我的感受就是情绪价值非常重要 。 我刷到后面我越觉得就是视频就是一个情绪价值 ,其实真的不在乎它有那么多那么多的知识要传递 , 更多的是让你感觉看完之后非常的舒服 。
其实我们今天这个想和 Medeo 团队聊哈 , 然后 ONE2X 有两位联创 , 王冠和姚行 , 然后我们也都和他们认识 ,并且也都特别喜欢他们 , 觉得是非常有趣的 , 特别的这个创业者 。
对 ,但这一次 Medeo 发布之后, 反而我和荣慧觉得最想邀请来上播客的是晨然 ,是因为一方面是我们之间更熟了 , 就是每个月我们几乎都会见面 , 然后另外一方面是因为其实我们觉得十字路口邀请了很多的创业者 , 很多的创始人 ,但是反而比较少有在一线真正这个所谓的就是把手弄脏 with dirty hands 在真正做产品搞设计做研发的人。
所以这个今天晨然来是想也和你多聊一些一线实战的一些感受 。 然后刚才你提到就是你会一方面做内容 , 一方面做研发 , 所以我很好奇就是在团队里面你会怎么描述自己扮演的角色 , 就和你配合的人还有哪些 ?
因为听起来好像你一个人就是一个队伍把很多事都给做了 。
首先我大部分时间确实是在做预研和调研的工作 , 大部分时间确实是一个人在做这些事情 。 我们的团队剩下的那就是我的坚实的后盾了 ,他们负责工程化呀 , 还有产品的所有的落地的事情 。
我基本上到了 demo 的那个阶段 , 我可能就把这些事情交给我的团队了 。 我的角色更多的是像一个预言家吧 , 就是因为我自己比较喜欢玩各种 AI 的工具 , 市面上的各种生成的视频的工具我都会玩一遍 , 然后新出一个东西 , 包括昨天不是正好发布 Claude 4.0 吗 ?
然后昨天也守着那个直播 , 看完之后等着那个 API,API 一出来我们就开始测试 , 然后测出来之后啊果然牛逼 。
大部分我的工作时间就是在因为也要追这种 AI 新闻嘛 , 我肯定需要知道一个新技术出来之后它可能会带来的一些变革 , 所以我会花很多时间去做各种各样的 demo,因为只有我觉得只有 demo 做出来 , 我才知道体感上这个东西是什么样子的 。
而且特别我最开心的就是把这个 pipeline 各种东西跑通之后, 它做出第一个视频之后, 我可能就会做出十个视频 , 一百个视频 , 看它效果如何 。
所以我的工作更像是一种像在画画一样 , 是一种创造性的东西 , 我觉得很好玩 。
其实晨然和我有一个之前的小合作 , 就是我们一起做了一个新事项的项目 , 叫做 AI 遗嘱 。 然后那个项目大概的意思是说这个我们鼓励每位年轻人都在今天暂停下来 , 比如说十分钟 , 然后在 AI 的引导和陪伴之下思考一下, 如果你真的要写一份遗嘱 , 你会怎么写 ?
然后这其实是一个想让人在一个极端情况下去思考什么对你来说是真正重要的 , 什么又是不重要的 。
然后在 AI 遗嘱这个产品里面 , 晨然不但做了研发 ,也做了产品和设计 , 包括有一张非常漂亮的海报也是当时晨然做的 。
我觉得看到那张海报是有一种就是哦在 AI 时代果然审美还是非常重要的 , 就是我们都知道怎么用 AI 生图 ,但是要用什么样的 prompt, 然后生出来之后要去做怎么样的这个审美上的选择 , 能看出这个人的审美决定最后产品的走向 。
竞品分析21:47
然后我们再回来聊一聊哈 , 就是刚才我们提到 ONE2X 有两位联创嘛 , 王冠和姚行 ,也都是很厉害的产品和很资深的这个 AI 行业的从业者 。
然后想问一下晨然你们团队内部是一个怎样的一个结构呀 ? 因为我知道你们是全员远程办公 , 即便王冠和姚行他俩都在北京 ,他们也不是天天在一个 office 里面 。
这是一个很特别的一个新的组织 , 想听你介绍一下, 然后也想听一听就是你自己和王冠和姚行工作配合的这个感受与体验 。
对 , 我们是全员远程办公的形式 ,其实这也是我这是我第二次尝试远程办公 。 我之前在美国实习的时候 , 当时在 TikTok 也是远程办公 , 所以远程办公对我来说不是一个非常大的压力 。
但是这也是我第一次体会到所有人远程办公是一个什么样的组织形态 。 首先我感觉所有的会议肯定都高效了很多 ,因为我们没有必要一直聚在一起开一个非常长的会 , 我们甚至会尽量刻意把这个时间控制在每天开的例会一定是在 30 分钟之内的 , 然后包括全员会那可能就是一小时之内 ,因为包括一些分享之类的 。
会议时间减少之后, 你大部分时间是在独处 , 你一个人在思考一个问题并解决一个问题 , 我觉得这对人的主动性要求非常高 。
然后整个团队我觉得磨合的就是超级超级棒 。 我们有了自主选择权去分配时间之后, 我感觉每个人其实更能够专心的把这事干好 。
而且我们本来也没有给团队所有人设定一个什么 KPI 啊或者指标去达成 , 我觉得这件事情应该是从招聘上去完成的 , 就是你只要招聘到了很好的高质量的人才 , 然后给他一个很适合的创新的环境 , 那他就会做出来 , 很主动的做出来一些创新的事情 。
我觉得这是 ONE2X 的一个比较好的基因吧 , 文化基因 。 然后我跟王冠和姚行的配合 , 说实话没有那么多的配合 ,因为我感觉我更多的花在花在的时间都是在写代码或者是调提示词 , 或者是调研各种工具上 。
然后我跟他们的配合更多是在战略上的沟通 , 比如说我们会选择在什么时候做什么事情 , 还有包括什么论文出来之后, 我们又得到了一些技术的验证 , 技术的验证假设 , 这些事情可能会坚定我们在哪条路上做什么事情 。
但是具体的就是这种脏活累活 , 我感觉很少有这种沟通 , 我感觉我一个人也能 handle 完 。
你刚才提到就是你们会一起去看一些有什么新的论文出来之后, 某些你们的想法方向得到验证 , 可不可以举一个例子啊 ?
就最近一次这样的一开始拿不准 ,但因为有一个新的技术的发布 , 新的论文的发布让你们觉得对了 , 这样的例子 。
首先我们在去年的时候我们就一直在看强化学习 ,因为我们相信这条路会有一个非常大的爆点 , 然后一直到 DeepSeek 出现了这个爆点之后, 我那天就非常兴奋 , 就是这条路是对的 。
因为我们之前做了一些产品的假设是基于这个技术假设去做的 , 姚行一直都会在每周的周会分享上去讲这一周发生了什么 , 发生了什么论文 。他非常非常的急 ,他会统计整个这个生态 , 这个这一周发生的所有论文他都会看 ,他是用 O3 辅助他帮他看 ,他所有论文都会过一遍 , 然后挑选几篇他觉得比较重要的技术路径的那个论文 。
然后我们从很早开始也在压谷歌的统一动态 ,因为它太强了 , 然后一直在等谷歌爆一个东西出来 , 结果上周谷歌又爆了个东西出来 。
反正统一动态这条路也是一个赌注吧 , 去年我们就在压这条路 , 所以才会有 ONE2X 这个公司 。
在 Medeo 你们看来哈 , 你们最大的竞品是哪些 ? 因为其实我有听到一些声音 , 就是说 Medeo 在 2025 年的 5 月份发布 ,但它能做的事情是 Invideo Veed.io 的一年前一年半之前就能做的 。
你怎么看这样的同质化 , 或者有没有什么差异化是其实大家没有看到的 , 才会出现这样的负面声音 ?
我觉得这个是肯定会有这样的声音的 ,因为说实话我们在最开始做的时候就看到了这些比较头部的竞品 ,但是我们本来公司成立的使命不是往这个方向去走 。
但是我的体感是最开始它肯定都会非常的像 ,因为你要做一个 AI 剪辑的产品或者 AI 视频制作的产品 , 它肯定也无法脱离掉视频表达本身所需要的产品的功能 。
比如说它肯定是我们想做 AI 生成的话 , 那它就是 AI 一键生成 , 那也差不多的 。 然后包括你要做编辑的话 , 那它编辑器肯定也长得差不多的 。
我觉得这些本身是会很趋同的 ,因为它的解法已经有 SOP 了 。 然后第二个就是我们我觉得本身产品就应该做的是去找那种 3% 的创新 , 我们更关心的是如何用智慧的方式为用户提供更有价值的信息商品 。
我们想要追求的是更少的 token, 更强的泛化性 , 提供更高质量的信息商品的结果 。 这就意味着我们会想要一直持续优化这样的视频效果 , 让模型能够做更高质量的信息表达 。
我们也觉得信息 , 我们也觉得视频会成为未来的信息表达方式 , 所以我们希望 Medeo 能够让不懂做视频表达的 , 没有天然训练过视频表达语法规则的人也能够通过视频去表达 。
我们并不是很想去做一个再做一个剪映或者是再做一个 Invideo, 我觉得这个是确实没什么意义的 。 我觉得现阶段看起来很像也是很正常的 , 未来的迭代就会很不一样了 。
刚才其实你有提到哈 , 就是你虽然和他们很像 ,但是其实使命不一样 。 那在你看来你们的使命是什么 ,他们的使命是什么 ?
首先我刚刚表达可能没表达完 , 就是首先我觉得人是有天然的做过语言的训练的 , 大家表达一个语言的语法规则是非常熟的 , 大家学过语文 ,但是人没有天然训练过对于视频的语法规则 。
你要去用视频剪辑工具去剪辑一个视频 , 你可能学工具就要学一会 ,但更多的是你不知道怎么去用视频的语法规则去表达一件事情 。
比如说你拍一个 vlog, 你要做怎么怎么去做叙事 , 你讲一个故事 , 你要怎么去做这个故事 , 你剪起来应该怎么才能符合这个剪辑的顺序关系 。
我觉得我们想要解决的问题是把这个表达的过程没有那么痛苦 , 让没有经过训练的小白或者是经过训练的专业用户能够非常快速的通过一个工具表达出来他们想要做的东西 , 无论这是一种新闻还是科普视频 , 还是说他们想要讲一个故事 , 还是说他们要做广告 。其实我们现在还没有特别明确的定义好 Medeo 想要服务于哪一类品类视频 , 这个也非
常取决于市场的反馈和这个技术应该往什么方向走 。 我觉得 ONE2X 相信的就是视频会成为信息的表达方式 , 就像文字一样 , 然后我们希望 Medeo 能够让每个人都能够通过视频的方式充分表达自己 。
而且我们也相信 ONE2X 是在辅助大家去做信息的表达 。 然后我们最相信的一句话叫做一份信息多份表达 ,因为在 AI 这个加工方式下的加持 ,有可能我们不再去关心中间的这个过程是怎么去加工的 , 怎么去剪辑的还是生成的 , 我们更关心的是结果 ,而这个结果可能是多份的表达方式 。
比如说你有同样一份信息源 , 你想要表达给老人看的 , 给小孩看的 , 给年轻人看的 , 给新潮思潮的人看的 , 那它可能表达方式就不一样 ,但它其实是一份信息的多份表达 。
我们想要完成的就是尽可能减少从一份信息到多份信息表达中间的痛苦 ,而视频是我们现在选的第一个表达方式 。
然后我其实听完之后还是有点困惑 , 就是听起来因为你刚才提到虽然现在产品长得一样 ,但使命不一样 , 所以现阶段的同质化在你们看来不是个问题 。
但是你说的这个使命 , 我觉得这个 Veed.io 和 Invideo 可能也认可 ,他们可能也这么想 。 那怎么去理解这个竞争 ?
就是会不会人家使命也一样 ,但其实一年前就做了你们现在在做的事 ?
我觉得这是很合理的质疑 。 我相信的是视频本身这个赛道是一个非常宽广的赛道 ,因为它的语言表达体系会很不一样 。
比如说你做一个营销视频剪辑 , 或者是做一个播客视频剪辑 , 它所需要的工具本身就不一样了 ,因为它依赖的表达要素就不一样 。
比如说播客当中可能更多是语音主导的 , 或者文字主导的信息传递 , 营销视频广告可能依赖的是一种情绪 , 一种还有音效 , 还有各种转场 , 还有商品的各种展示 , 那它所做出来的工具本身就会不一样 。
然后我们现在暂时选的这个品类是新闻科普知识 , 或者是故事这类视频 , 那它就区别于比如说带人像的 ,有带人脸的上字幕的这一类视频 。
我觉得视频本身是取决于你想要完成什么样的品类视频的工具就会往什么方向发展 ,但最开始你肯定是一个剪辑工具 , 所以最开始肯定都会很像 。
一旦你确定好了你的品类 , 往那个方向走之后就会很不一样 。 我们肯定不会想要去再做一个剪映 ,因为剪映是一个通用剪辑工具嘛 , 它就像是一个可以完成各种代码的 IDE, 它什么都可以做 ,但也有垂类的场景等着去探索 。
但这个我觉得现在太早期 , 我们也很难去固化我们一定是往哪个方向走 。
所以现在其实你们还没有找到一个认为要固化的一个或多个方向 ,因此这也是为什么大家都长得比较像 。
那这个会不会也是另外一个问题啊 ? 就是 Veed.io 或 Invideo 做了那么久了 ,他们其实也没有往某个方向去固化 , 那是不是就做到某个垂直领域 , 这也不一定是所有人最后竞争的一个选择呢 ?
有可能这个市场就会赢家通吃 ?
我不太认为这个市场会被一个工具给主导的通吃 ,因为我还是觉得视频是一个非常宽广的赛道 。 你刚说 Veed.io 没有固化 , 我是相信 Veed.io 早就固化了 。
你可以去看它的营销 , 它的营销所有的营销点基本上是在说字幕 , 它的解决的痛点基本上都是就是口播 , 带口播的人像视频上字幕这个痛点 , 然后做人物的剪辑 , 这个是它最大的亮点吧 , 至少它的首级端它是这么去宣传的 , 就是各种各样的 fancy 的字幕 , 它也因此而出圈了挺多 ,因为它字幕特效挺好看的 。
我觉得大家会有自己侧重的一个擅长的领域的 。 然后视频 ,而且视频的表达语法本身就很丰富 , 你可以在字幕做得很精进 , 你可以在音效上做得很牛逼 , 你也可以可能在生成的功能上做得很牛逼 ,但你想要把所有功能都做好 , 我觉得是不大可能的 , 除非是像剪映这种超级大玩家 。
但是即便它做到 , 即便剪映做到所有东西都通吃 , 比如说像 PR 它什么东西都能干之后, 那就肯定会有一个人希望有一个更简洁的工具能够只完成它某一类视频的剪辑 。
工具类产品就是这样 , 它不会是一个玩家一直在那顶住的现象 , 即便它做得很多 , 什么功能都有 , 什么都有 , 它的臃肿就是一个劣势嘛 , 那它就会有更简洁的 , 比如说专为播客而生的 , 只剪播客的 , 我就只是上个字幕 , 我为什么要上这么重的东西呢 , 对吧 ?
而且如果你只要做得很垂 , 你就可以做反复的优化 , 你有可能训一个模型 , 你有可能专门做为播客再做一些非常细节的雕花 , 大家会为这种东西买单的 。
我觉得这个观点你可以再看一下 ,其实像现在还有一些那个别的 Agent 的公司 ,他们可能也会再加入什么视频生成的 , 我相信那个时候又会有人来问 , 那这个东西和你们这个有什么区别呢 ?
Agent思考33:56
那肯定是有区别的 ,因为你如果想改的时候 , 你还是会回到一个带有 editor 的界面 , 一个编辑器界面 。
如果你要改它的字幕 , 你最好还是通过 GUI 去操作 ,因为这是剪辑产品不可绕过的一些非常简单的细节 。
但是一旦问起这种简单的细节 , 反而是通用的一些 , 如果 Agent 它加了这些东西 , 它虽然生成出来 ,但它很难改 , 这也是一个弊端吧 。
所以大家可能最后的产物都会很像 ,但是它的路径会非常不一样 ,而且用户去完成一个产物的生产的路径也会很不一样 。
对 , 确实 LAVA2 就可以直接这个作为一个第三 Agent, 可以直接生成视频 。 因此当你看到它的时候 , 你觉得除了它生成的这个视频目前不带编辑功能之外, 当我觉得 maybe 未来它是会带的 ,因为它现在生成的图片都是可以这个单元素去再做二次编辑嘛 。
那如果进一步发展 , 它也有了更多的资金 ,有了更多的用户 , 它很可能下一步就会上这个功能 。
那我们再更这个泛一点说吧 , 就是你怎么看今天就是全世界都在做 AI Agent 这件事情 , 就是有没有一些和大家不一样的想法 ?
Agent 这件事情我是有一些想法的 。 首先我们其实在内部也探索了很多关于 Agent 和我们在内部也探讨了很多关于 Agent 和 workflow, 它们到底有什么优点和缺点 , 什么时候用 Agent, 什么时候用 workflow。
而我觉得在至少在 Medeo 这个产品当中, 我觉得在剪辑这个领域本身是有一套人脑的 SOP 的 。 比如说我作为导演 , 我作为一个剪辑师去剪视频的时候 , 我大概率会经过好几个步骤 , 第一个步骤素材整理 , 然后理解一下素材到底在干嘛 , 然后大概构思一下现在视频的脚本是什么样子的 , 然后想了一个脚本之后, 然后就开始粗剪 , 粗剪完了之后就
会进行精剪 , 精剪就调一些小的一些瑕疵 , 或者剪一些气口啊 , 或者是加一些字幕什么的 , 就做一些包装 。
既然人脑或者是我们剪辑师都是以这样的方式去工作的 , 那其实它更像是一个已经固化好的一个有流程的概念 。
而如果它已经很流程化了 , 那我觉得 Agent 在这个场景下可能就没有那么适合 。 我更愿意提的另外一个词汇叫做 agentic,而不是说 Agent,因为 Agent 更像是一个实体 , 一个真的打工人嘛 。
我觉得 agentic 是一种方式 , 它是一种技术方式 。 如果你想要解决的问题是一个开放优问题 , 你不知道用户会干什么 , 那可能 agentic 的方式它是更适合的 ,因为开放的问题需要用开放的解法去回答 。
但是像视频创作这样的领域 ,在很多的那个 SOP 当中已经非常固化了 , 它先粗剪再精剪 , 那它更适合工作流 。
所以我觉得我更相信的是在视频领域应该是 80% 的 workflow 和 20% 的 agentic,而这样做才能更好的稳定的交付一个结果 。
我们再聊另外一个有意思的话题哈 , 就是我觉得晨然是有很多的实践 ,也有非常多的思考 。在 AI 领域有什么样的最近大家新形成的共识是你特别不认可的 ?
我觉得是 MCP 吧 。 我觉得首先我对 MCP 是一个非常谨慎的态度 ,因为我感觉它是一种协议 ,并且它其实想要解决的问题并不是一个技术问题 。
协议它解决的是一种生态的问题 , 它其实是解决的便携性的问题 , 它并没有带来一个非常跨时代的技术 ,而它鼓励的是模型和工具之间的交换和交流的能力 。
它归根结底还是一个提示词的管理方式 ,但是提示词也有很多别的管理方式嘛 , 你可以自己决定你如何管理这种上下文 , 如何处理模型的输出结果和如何结构化和如何省你的成本 。
但是 MCP 我是感觉市场上对于它的探讨其实是非常非常热烈的 ,而且它的新闻啊 , 还有包括大家就是营销上的爆点可能都会带上这个词 ,但实际生产落地当中, 它也没有真的解决一个很大的问题 。
特别是像我们这种如果要做一个垂类场景 , 本来也不是很需要谈生态扩展 , 那 MCP 对我们本来就不是特别大的帮助 。
但我知道有一些人肯定会因为 MCP 受益 , 比如说像一些平台化的产品 , 比如说像 Coze, 它如果要做 Agent, 它肯定加上 MCP 让大家都能做可插拔的插件 , 这当然是它的优势 。
但如果你要做一个垂类的产品 , 可以没有那么优先级高的去考虑 MCP 这件事情 ,因为它又给你代码工程上带来一个复杂度 ,但它也没有解决你的技术实际问题 。
第二个我想聊的是我越来越感觉就是解决用户的需求不一定需要用最优的技术 , 这个技术可能是一个框架 , 比如说 Agent 就刚刚说的嘛 , 刚刚说过了 , 我就不再说了 。
还有一个是有可能你也不需要用最好的模型 ,因为大家现在做 AI 产品肯定都是混合的 , 上各种模型来解决一个问题 , 通过一个比较复杂的系统来解决整个问题嘛 , 都是端到端的交付结果 。
但是你这个中间的每一个节点在干什么 , 它可能不太需要用最好的模型去干 。 而且我甚至发现有的时候把模型从 3.5 Sonnet 切换到 3.7 Sonnet, 它的表现效果还更差了 , 这个也是时有发生的 , 它会有一些细微的差异 , 就很奇怪的差异 。
我本来以为生模型会让我更好 ,但是由于它们训模型 , 每一个模型厂商的数据 alignment 会做得很不一样 , 比如说 Claude 它会把 coding 的能力放得最高 , 那它可能在别的任务当中会有一些小小的损失 , 这个损失可能在你实际你的业务场景的任务当中测的时候 , 你才会发现它有点损失 。
而且它会有一些奇怪的 Claude 3.7 比 Claude 3.5 会有一些指令遵循的小的 bug, 然后这些东西你可能你不测你是很难知道的 , 包括你在新闻当中你肯定也很难知道的 , 这种东西只有在一线的实操的人去真的调过提示词 , 你才会发现这些认知 ,而这些认知一般都不会在市面上去流通 , 它可能会在某一个论坛的某一个小角落出现 ,但是确实这样的信息很难找到二
次验证 , 这个只有自己去用自己的眼睛看到才知道 。 所以这个认知就是不要盲目相信用最好的技术 ,而且也有可能解决这个问题也不需要最好的技术 。
这里正好想问一个轻松一点的问题啊 , 就是我最近发现身边大家在用的这个模型 , 就不是用来编程哈 , 就日常问答的模型 , 都已经开始变得非常的这个千奇百怪 , 就是好像每个人的这个喜好都不太一样 。
那比如我自己最近就因为这个 ChatGPT 加了 memory 功能 ,也因为有一个朋友在 ChatGPT 工作 , 送了我这个 Pro 会员 , 我可以用很长时间的免费 Pro 会员 , 就这俩叠加在一起 , 我就觉得越用越被套到这个整个 ChatGPT 的生态系统里面 , 觉得每天就是开始只和它对话了 。
工具偏好41:29
然后晨然你最近用什么用得最多 ?
因为我大部分时间用 Cursor 嘛 ,Cursor 有什么模型我都会尝试一下 。 我写代码的话 , 我最多用的还是 Claude,Claude 系列的 , 然后 Claude 3.7 Thinking, 然后还有 Gemini 2.5 Pro Preview, 这些我最喜欢就是 Gemini 和 Claude 嘛 。
然后 Gemini 它有 , 就这两个模型它有自己的脾气 , 就 Gemini 可能是因为训了动物态 , 我不太清楚是不是因为这个原因啊 ,但是它审美确实比 Claude 要好一点点 。
但是它的特点就是它输出的东西就没有 Claude 这么复杂 , 我一直称 Claude 3.7 是一个多动症小孩 , 它会一直做各种各样的事情 , 特别它在 Cursor 里面工作的时候 , 你已经完成这个需求了 , 它还要去故意再给你重构一下, 优化一下, 再多加几个 file, 多加几个函数 , 它是非常多动症 。
然后它指令遵循能力没有那么 , 没有 3.5 好 , 这两个模型确实我用得比较多 , 就是你用多了就会感觉脾气就真不一样 。OpenAI 的模型我反而用得越来越少了 , 我只会用它的图像模型嘛 ,因为 OpenAI 它给我的输出的感觉是比较严肃 , 比较严格 , 然后非常数学 , 非常怎么说呢 , 非常具有科学的意味 。
我觉得可能是因为那个 OpenAI 一直想要解决科学问题 ,在数理啊 , 然后物理这些方面一直做了很多优化 , 特别是它会经常给我输出表格 , 我不是很喜欢看表格 ,但是我知道有很多人喜欢 , 比如说姚醒他就是高强度使用 OpenAI,因为他觉得 OpenAI 输出的东西非常的干货 , 没有口水话 , 然后都是表格 , 非常结构化 ,因为他是非常的 J 人, 然后我这个 P 人我就很
需要情绪价值 。
对 , 我也想说 , 我也是 J 人就很喜欢看表格 , 看到表格就好开心 , 说我靠这样的一个混沌信息也能给我整理个表格出来 , 一下子世界都清晰了 。
但我看到表格我就头晕了 , 我很讨厌表格 , 然后所以我就没有那么喜欢 OpenAI,但大家都会有自己的倾向性嘛 。
我看最近 Grok 那边也挺多用户在聊的 , 特别少数呢刷了很多人去玩 Grok 的那个文字模型 , 然后我觉得看大家的场景吧 , 就像普通的问答场景 , 基本上各家都差不多 。
那晨然你作为一个 PM, 你在做 Medeo 这个产品的过程中思考最多 , 或者是你觉得你思考的最重要的那个问题是什么 ?
我觉得这个很有意思 。 我在做 Medeo 的时候一直在看另外一个产品 , 我很喜欢 Cursor,其实提了很多很多次了 。
我相信大家都会被 Cursor 给启发到 , 先讲 Cursor 给我带来的启发吧 。 然后 Cursor 它解决的一个问题是它解决了三个边的关系 , 就以前我们做一个产品的时候 , 可能只会考虑传统的这个产品工具 , 或者这个产品本身它和人之间的交互 , 它只有两个端 , 它这两个端只有一个边 。
所以你做的所有的路径 , 你比如产品的用户体验路径 , 你基本上在用户来之前你是可以被梳理完的 , 就是非常非常确定性的 , 它是有分支的 ,有决策树的 。
但是有了 AI 的加持下, 它就会变成三个端的关系 , 它有三个顶点 , 就是传统的产品 、 人 、 还有 AI, 那它的连线就会有三条边 。
我们在做 AI 剪辑的产品 , 那首先得有一个剪辑产品 , 才会说有一个 AI 在里面干活 ,并且人还需要它在里面干活 , 你还会给它派活继续修改 。
我相信现在所有 AI 产品都是这样去思考的 , 它是三边嘛 。 然后 Cursor 做得比较好的就是它用各种 , 它有一套非常明确的划分功能的方式 , 就是它的 AI 能干的事情和 AI 获取的权限和 AI 执行权限的递增 , 它就有各种不一样的功能点 , 比如说它在 inline 的 tab 啊 , 然后再往上就是 edit, 然后再往上就是 chat, 再往上就是 agent。
这个模式我觉得它真的想得非常非常清楚 ,而且中间过程也非常的明确 , 它就解决了这个交互关系 。
然后我在 Medeo 当中最经常思考的就是这个问题 , 这个三端关系应该怎么解 ,因为你首先得兼顾原来的传统的剪辑软件 , 然后人跟剪辑软件的交互你是很容易思考清楚的 ,但是 AI 怎么在这个软件当中去干什么事情 , 这个还是挺难的 ,因为相当于你会把一部分的人创造的过程放到了工具里面 , 这一点是以前的传统产品不会去考虑的 , 你
不会考虑用户来之前他要创造什么东西 , 一定要把它做出来 。 但是你现在做 AI 产品基本上你就是你自己得成为一个创造者 , 你会成为创作者之后, 把这个东西在你的产品当中自己做出来 , 用 AI 做出来之后, 然后等着用户来 , 然后这个分支条件就已经 hold 不住了 ,因为它有无限可能性 , 所以这一点是我觉得非常非常困难的 。
第二个我经常思考的就是做内容嘛 , 就我发现 AI 其实很难产生一些超越人类的点子 , 它给我很多 aha moment 的点子 , 比如说它写的稿子 , 我测多了我都能猜到它会写什么样的稿子 , 写什么样的分镜头 , 写什么样的设计 ,其实这种 aha moment 很难找到 。
所以为什么我会对新模型这么感兴趣 ,因为我很想知道新模型的 aha moment 在哪里 。 但我现在觉得 AI 它最适合的不是做这些替代人的创意的角色 ,而它应该适合做的是那种带有一部分智慧的执行角色 , 就已经有 SOP 的事情交给 AI 去做 , 这种脏活累活 , 比如说批量的写提示词 , 批量的抽卡 , 还有优化提示词 , 写一段很长的 prompt, 或者是帮你写一个已
经有 SOP 的分镜头的详细描述 , 还有包括它自动化执行有 24 小时 ,其实这些是 AI 最擅长的 , 就是它有一定的智慧 ,但它也可以发挥它的无限的算力 、 无限的时间的这个特性 。
我觉得 AI 产品应该把它最大化 , 如果你想让它去给你一个非常 aha moment 的创意 , 真的很难 。 我觉得在这上面发力的话就很容易碰壁 。
如果你有一套 SOP 的东西 , 让它做执行 , 这是最擅长的 , 这是它最最最适合的 , 就把它最大化是我经常考虑的问题 。
那正好说到 Cursor, 就是也想问问你 , 我们之前聊天的时候你也提到非常的喜欢这个产品嘛 , 像我们前面聊了这么多 , 你做产品的过程有哪些就是你自己特别喜欢的 ?
当然 Cursor 是一个例子哈 , 就是你特别喜欢的产品 , 然后它们传达给用户的感受 ,以及你刚刚说到你这个特别喜欢第一时间能够用新的产品 、 新的模型 , 你现在一天大概会是一个怎么样子的度过 ?
日常节奏48:24
今天我们是一个礼拜五在录制 , 然后最新最新你用的哪些的模型或者是产品让你觉得特别有想跟大家分享的 ?
首先我怎么去度过我的一天 ,其实刚刚我讲了我工作上做的事情嘛 , 我有的时候休息的时间我可能会花更多的精力去做输入 , 就是看一些电影 , 看电视剧 , 还有听歌 , 还有研究一些电影潮流文化 , 还有看书拉篇的事情 。
我最近在补一些跟编剧相关的知识 ,因为我感觉我没有在电影学院上过课 ,但我觉得这些东西又很重要 , 所以在补一些编剧的原理吧 。
然后兴趣爱好也就挺喜欢看这些拉篇的事情的 , 我吃饭的时候也会看 , 然后睡前也会看一些书 。
然后我还在探索的就是怎么去成为一个创作者嘛 , 就我觉得这个在工作之余其实要保留一个创作欲其实是一个很难的事情 ,因为你们其实也在创作嘛 。
我记得印象很深刻 , 你们在来之前也说不用现在说 ,因为可能就把创作欲给释放了 。 我觉得是 , 它就是一个很极其脆弱的事情 , 然后我目前还在探索我到底应该怎么去最大化我的创作欲 。
然后第二个问题是你刚刚说最近试的产品 , 我先把 Cursor 讲完吧 。 我觉得 Cursor 虽然是去年发的产品 ,但还是我觉得做得最好的一个产品 ,因为它是一个真的落产的产品 , 它解决的问题是 AI 和人的交互 ,并且在 AI 可操作范围之内来定义自己的功能区域 ,并且真的在落产当中稳定地交付一个结果给用户使用 。
因为现在的 AI 产品很多都是一个概念 , 或者说它是一个 �形 , 包括我们其实也是一个雏形吧 , 它很难做到一个真的真的交付一个很强的结果 ,但 Cursor 其实做到的 。
为什么它做到 ? 是因为它已经解决了就是如何在 Cursor 的 AI 当中去写代码这件事情 ,因为它用了模型最强的能力嘛 。
就其实有点反直觉的是 , 这些事情稳定落产是一个产品的基本需求 , 反而是 AI 产品当中最最最最难的事情 ,因为我一直感觉 AI 产品是在从随机当中找这个确定性 , 这个就特别特别难 ,因为随机就是一个商特别高的地方嘛 , 你要克服商增去做工才能去得到一个稳定的结果 , 这个确实太难了 。
然后最近我肯定在测一些 Agent 产品啊 , 比如说 Manus 和 Labart, 我觉得它们都会有一些很惊喜的东西 , 然后这个相信大家也看到了 。
你刚才说这个稳定交付的这个关键词 , 我想补充一个问题是 , 你觉得在短期或者是相对长期 , 可能我说的短期是比如说一年内 , 相对长期是两三年内 , 发生什么可以让整个行业发生什么可以让稳定交付这件事情稍微更普遍一些 ?
我觉得稳定交付是一个产品层面去解决的问题 , 它不算是需要等一个新技术来解决的问题 ,因为产品的稳定性是指用户在完成同样的操作之后, 它希望得到的结果大概率是一致的 , 或者有那么一点随机性 ,但它随机性也算是一种可控参数嘛 , 就像 Midjourney 当中有一个 randomness 的一个那个滑块 , 你再滑动 randomness 越高 , 你本来期待的也是一个更随机的结果 。
但是现在产品很难去解决这件事情 , 就是因为本身这件事情的工程化是很难的 , 比如说你现在的 Agent 的产品 , 它虽然可能第一次能够给你一个非常惊喜的结果 ,但用户的预期会变成我希望下次还是它 ,但做过 Agent 的都知道你下次还是它的概率很小 。
它有可能就简单的你让它做一个网页 , 它可能下次做的网页跟你现在做的网页就完全不一样 , 用的技术栈也完全都不一样 ,但说实话用户会有这个预期 ,他会想要稳定的结果 ,但我觉得这个是需要给产品时间 ,而不是说需要等下一个技术 。
对 , 就是 PM 都不笨都不傻 , 就是他们都知道这个稳定性的很重要 ,但是就像你说的 , 它跟用户的预期之间是存在一个鸿沟的 , 这个鸿沟是什么 ?
我觉得 PM 肯定都知道我们需要去找一个更稳定的路径 , 让用户能够有一定的预期 ,并且超出他的预期完成这件事情 。
但是 AI 产品难的就是我刚刚说的 , 你从随机当中找确定性是非常难的 。 以前我们做产品 , 你在用户来之前 , 你是可以画一个 roadmap 的 , 用户第一步点了什么东西 , 发生了什么事情 , 触发了什么什么东西 ,他下一步再去什么什么地方点 , 这个流程太清晰易懂了 , 你在来之前都可以枚举完 。
但是 AI 因为它有随机性 ,而且它的步骤非常多 , 你如果是一个 100 步骤的 AI 的这个问答 , 那它最后会产生什么样的东西 ,是以人类无法 hold 住的一件事情 。
就是大家都希望有它的随机 ,但是这个随机能不能可控 , 我觉得是很难的 。 我一直都会想举个例子 , 就是塞尔达 , 就是塞尔达的那个王国之泪和那个旷野之息 ,他们做开放世界 , 我看了他们很多做游戏设计的这个讲解 ,他们做开放世界并不是说真的有一个纯开放世界 , 你自由的探索 ,因为自由一定是在一种限定的范围当中去做 , 谈自由才会有意义
, 要不然你就只是纯一个那个开放的东西 , 你没有任何交互 , 没有跟世界的交互 , 那你去开放乱走也没什么意义 。他们会设定一些比较大的目标 , 比如说塔 ,他也会设定一些很小的奖励目标 , 比如说亚哈 , 所以你在探索的过程当中, 你大概率不会走直线去开塔 , 你会在看到一些乱七八糟的东西就绕了个弯路 , 然后又绕了个弯路 , 然后又绕了
个弯路 , 每个人的体验都会很不一样 , 都很随机 ,但这些都是他们精心设计的一些大大小小的奖励点 。
然后我觉得 AI 产品难就难在它也得把这些奖励点或者是这些随机性的带来的
正反馈给做好 , 这件事情就需要时间 。 我觉得是因为这个行业还没有完全成熟 ,在这个 AI 产品这条路上去成熟 , 大家肯定都知道是这样 ,但是很难 , 就是它需要一定的时间去孵化一个更好的产品 。
那是不是可以理解为其实换一个角度想 , 这个里面也有巨大的机会 ?
我觉得就是只能等吧 ,也可能是我们做出来 ,也可能是别人做出来 。 就我还是想类比塞尔达 , 就是当塞尔达旷野之息发出来那一刻 , 大家看到的那种 aha moment, 这个东西可能会在某一个 AI 产品当中也会产生 , 每个用户都会分享自己的非常不一样的 use case, 然后每一个人都有自己独特的开放世界体验 。其实 AI 产品就是开放世界嘛 , 每个人本来就是一个非常独特
的体验的 , 然后这个东西我觉得只能到那个时候出现 , 你才知道就是它了 ,但大家都会往这个方向尝试 , 我们也会往这个方向尝试 。
年轻与机会55:53
那你有看到你身边的人在积极的投身这样的机会吗 ?
我身边其实大部分都是做 AI 的创业者 , 比如说也来过你们播客嘛 , 海星 , 海星阿文 , 然后还有非常强的刚获得小红书的独立开发者金奖的倪皋 , 然后都是非常强的超级个体 ,他们在艺术审美上和开发能力上, 我觉得都是走出了自己的野路子 , 绝对不是说在学校里面学到什么什么东西 , 都是自己一步一步去因为自己的热爱的东西 , 然后一
直去钻研 , 然后踩出了一条跟别人不一样的路 。 我觉得这也是现在 AI 给大家带来的新的机会吧 , 就是每个人踩的路可能都不一样了 ,因为它打破了传统的你必须要学 , 比如说你要先学前端的什么什么 , 再学前端的什么什么什么 ,因为现在有了 AI 的这个教育资源 , 每个人都可以学不一样的技术栈 , 你想要做什么东西你都可以问 AI, 我觉
得这是给年轻人的一个很大的机会 。 还有一个就是因为我是 99 年的 , 我没有特别多的市场经验 , 大家可能听我的播客也会感觉到我没有很多 , 比如说一些商业的 sense 或者是商业的经验 ,但我觉得这也无妨 ,因为我觉得年轻人也有年轻人的机会 , 就是我们的思维可能没有那么局限于传统做一个产品应该需要做的什么事情 ,因为 AI 它本来就是太新了 ,以至于很
多以前有经验的人会被这个东西给束缚掉 , 然后看 AI 的时候可能用原来的方式去理解就理解不了了 。
然后年轻人本来就胆子大嘛 , 就是你只要艺高人胆大 , 还是能做出来很多好玩的事情的 。 然后当这个局面非常的混乱的时候 , 那肯定是新的力量涌上来的机会 。
我之前在大厂里面就深刻体会到 , 就是因为大家都不懂 , 然后我成了最懂的人 ,但明明我是最经验最不足的人 ,因为在 AI 的这个新时代 , 我觉得大家都是众生平等的 。
你说这个我想到我们前面嘉宾童钊 , 就是他说他的一个特别强烈的感受就是其实在 AI 这个时代没有谁的认知比谁更超前 , 大家比的是谁能比谁迭代的更快 。
当然我有利益相关 , 我是年轻人所以肯定会这么说 ,因为这给我带来很大机会 。 我也不敢说我的经验比别人更丰富 ,但是我觉得大家都在同一水平线去做这件事情的话 , 勇于去尝试做 Demo 是一件非常重要的事情 ,因为我大部分时间就是在做各种 Demo, 我甚至工作之后我也会做一些小的自己的小玩意儿去测一测 , 这种测真的不是说一定是有什么结果
的测 , 它只是为了找一种感觉 ,因为现在 AI 产品就是你没等它发出来之前 , 你不知道那个感觉是什么样子的 ,而这个认知是需要最快的速度去迭代的 , 比如说昨天 Claude 4.0 一出来 , 那这又会有很新的产品形态可能会因为这个技术而成熟 , 比如说 GPT-4o 发了 image 的那个生成 , 它第一次实现到了图片到图片的完全一致性 , 然后 Labart 就因此而大放光彩
嘛 ,因为 Labart 它中间如果要去保持一致性 , 我看基本上都是 GPT-4o 去做的嘛 , 这种东西我觉得就是那个技术一出来 , 你就得非常快速的去试 , 你才能最早的去接触到这个认知 。
前面你也说只有 Demo 做出来自己才知道体感 , 比如首先最近比如说一个月之内可能就是在一个时间限度之内你可能会做多少个 , 你觉得这些 Demo 做出来给自己带来的特别实际的收获是哪些呀 ?
就是测一测那个感觉 , 感觉内化出来的是什么 ?
首先我在做 Demo 或者测各种工具的时候 , 我没有一个明确的目的性 , 我是一个极其批人, 然后我很多事情都是随机去做的 , 我很难说我这周一定要计划做一个 Demo, 我一般都是即兴的 , 就是今天突然有一个 idea 我就想做一做 , 然后你在做的过程当中你其实是享受做的过程 ,而不是说非得拿到一个结果 ,因为我大部分做的东西都是没有意义的 , 就是在你回看
的时候你都会发现这个东西没什么价值 , 没什么东西 ,但是它就会在某一刻你在做别的项目的时候 , 你把之前的那些经验就可以用起来了 ,但是如果你就是正向去推过去 , 你是为了用起来去做什么事情 , 你很难做出来什么东西 , 就只能说你对这个东西感兴趣 , 比如说我对视频感兴趣 , 我就一直在测 Gemini 2.5 Pro 来做自动剪辑 , 我对
它的能力上限是有一个非常强的体感的 ,但这个真的只是因为我热爱 ,不是说我在干这个工作 , 我是觉得这种事情就应该 AI 做 , 所以我一直想测 , 我觉得还是找到自己想热爱的东西吧 。
我觉得这个特性一直可以回溯到我最开始遇到 ChatGPT, 当时 ChatGPT 我那个时候还在美国读书 ,ChatGPT 刚出来的时候周围人其实没有人讨论 ,但它刚出来的第一天我就开始用了 ,因为我当时第一次感觉到我学的这个专业竟然还有一些好玩的事情 ,因为在这之前我以为我的专业就是去做人脸识别 , 我就觉得很无聊 , 我当时还学的其实就是计算机视觉 ,但我觉得很无聊
,但 GPT 出来之后我立马就两眼放光 , 我就觉得这个太好玩了 , 它竟然可以对话 ,因为我也做过自然远处的嘛之前 , 然后它对话给我的感觉太不一样了 , 然后我就我那几天都在熬夜 , 就是我每天就在跟它发消息 , 我那个时候就在跟它打辩论赛 , 跟它玩海龟汤 , 然后跟它玩情感陪伴 , 就是那个我那个时候就把各种玩法都测过一遍 ,其
实后来才发现原来这个东西竟然是赛道 , 我那个时候还没有特别多的商业感觉嘛 ,但是我只是觉得好玩 , 然后这种好玩
是一种非常
稀有的品质吧 , 就是如果你发现这件事情很好玩 , 那用户也会发现这件事情很好玩 。 我觉得一个好的产品能让用户感受到这种情感的传递 , 它大概率它的创作者是本身富有很强的情感觉得它好玩的 。
我觉得如果创作者觉得它在这个过程当中好玩非常有意思 , 那它创作的东西也会让观众和用户体会到 , 所以我尽可能的想要让自己处于一个情绪充沛的阶段 , 就是随机的去做一些情感充沛的这种探索 。
如果我找到那个 aha moment, 那我相信用户也会感受到我的 aha moment。
我刚这个问题我觉得其实不是说你可能带着某种目的去做什么事 , 就是我觉得这是一个前置性的目标 , 我想就是其实我想问的是就是在所有的这些事情结束了之后, 你自己再一个总结 , 它可能已经变成你自己的某种习惯或者是某种心得 , 就比如说哈我举个例子 , 我举我自己的例子吧 , 就比如说最开始做这个播客 , 我肯定不是冲着提高自己的表达
能力去的 ,也没有想特别多 , 然后但我其实会到今年, 我觉得是到今年有一个点的时候 , 我开始终于感觉我说话的时候可能没有原来那么紧张了 , 我最开始肯定不是为了让我以后不要说话紧张 。
是的是的是的 , 你说我在这中间收获了什么对吧 , 我觉得还是回到那个好玩吧 ,因为我很多我的情绪正反馈都来源于我做出来一些好玩的 Demo, 它做的这个过程就有点像拼乐高嘛 , 这个过程本身是很享受的 , 它甚至有一种像我的娱乐方式 , 我不知道怎么解释这个 ,而且当你做出来一个 Demo 之后, 我们现在 AI 的创业者之间也会经常互相交流
, 然后我们也会互相展示最近自己做过的 Demo, 就是海星它发起了那个 Demo 印嘛 , 然后当我们互相展示自己最近又凭热爱做出来什么 Demo 的时候 , 那个感觉是我很享受的 , 我觉得它不是说给我带来了一个很强的技术上的提升或者什么什么东西 , 没有这种感觉 , 我觉得它是一种生活方式 , 是一种它已经融入到生活的娱乐方式当中, 对 , 你就会享受它 ,其实你
如果享受这种感觉就可以了 , 我也没有企图从当中获得些什么 。
我觉得其实让我想起那个 Paul Graham 那篇文章 , 就是说 How to do great work 如何成就伟大事业 , 里面有讲说就是找到你干起来很轻松 、 毫不费劲 ,但是对别人来说这个还挺不容易的事 , 当你找到这么一个事的时候 , 认真的去干它 ,有可能你得到的这个回报就会非常的好 , 那可能陈然做的这个事情正好是今天也是这个最 hype 的事情是 AI 对吧 ,但对另外
一些人来说可能是钓鱼 , 可能是官鸟 ,但是找到一个你自己擅长 、 做起来很轻松 、 很有成就感 ,但是别人也觉得怎么这个事我干起来有点费劲 , 找到这样的事情其实就是一个人非常大的幸运 。
其实说到这个 enjoy 其实我感觉可能听感上会觉得这是一个很小我的事情 ,但是我的体感是现在很难再谈一个超级世界英雄主义了 , 我这一代我是非常深刻体会到就是经济下行从我开始 , 从我们这一代开始 , 然后包括我再往前的一些学长学姐找工作都挺容易的 ,但到我们这一届或者是上一届开始就都找不到工作 , 然后大家其实没有那么多很大的梦想了 , 然后
仅仅是维持好自己的情绪稳定都已经很不错了 , 然后在此同时你还要有一些梦想 , 我觉得我的梦想是肯定没有丢的 , 即便是经济下行 , 即便是我觉得大家都越来越只关注自己 ,而不是说关注这个社会怎么样 , 或者是社会再怎么进步其实跟我没啥关系 , 我觉得我还是有这样的梦想的 , 我现在在做这个产品做 Medeo 其实是本来就是我一直以来的
梦想 , 我在大一的时候就开始学自学一些做导演的事情 , 然后拍各种片子 , 我是没想到 AI 和创作我的专业领域和我的兴趣领域能够结合在一起的 , 所以现在在做的事情就是我一直想做的事情 , 我觉得我还是有这种创作的梦想的 , 就无论是产品的创作还是视频内容的创作 ,但是我觉得这个时代最难保留的其实是自己的创作欲和这
种激情 ,因为我觉得很难在一个一直持续萎靡的这种经济环境 , 或者是大家身边都过得不是很如意的情况下去谈自己的梦想 ,因为我跟我的很好的朋友去谈论我的梦想的时候 ,他们只会觉得挺好的 , 跟我什么关系 ,因为说实话就是现在就是这个状况嘛 , 我觉得所以保留这种激情 , 保留这种活力 , 保留这种创作欲是非常非常非常关键的
, 我现在也在持续寻找我的创作欲 , 我觉得可能是我人生经历还不够 ,但是至少我在这条路上, 我觉得希望也给大家有一些启发 。
我很能共情 , 我也想保留我的创作欲 ,因为我觉得还有一个挑战是有很多事情 AI 都可以帮你做了 ,以及社交媒体上有太多太多千篇一律你都不用动脑子你都可以背出来的一些大家都这么说话的一些就是所谓 cliché 陈词滥调 , 然后你刚其实说到有一个点我想补充一个问题是你说到你在读大学的时候本来以为自己的专业没有用了 , 然后那个时候看到了 ChatGPT, 为
啥那个时候会觉得自己的专业没有用了 , 当时的大概的比如说行业是一个什么样子 , 然后你看到 ChatGPT 的第一个感觉是什么 ?
我本科是在 21 年毕业的 , 然后其实那个时候还算是互联网的一个比较高峰期 ,因为大家还是比较找到很好的工作 , 然后薪资也会比较高 ,但我感觉那个是快到顶点了 , 或者说已经到顶点了 , 只是我那个时候体感不是很深刻 , 什么叫做经济周期 , 什么叫做顶点 , 或者什么叫做移动互联网的高峰 ,但过了才知道原来那个时候就是高峰 ,因为那
个时候我的感觉是所有东西都已经很成熟了 , 大家已经有很成熟的这些商业化的落地的各种应用了 ,但是技术好像一直没有什么新的突破 , 或者技术没有产生一些新的可能性 ,其实在这种秩序比较森严的情况下, 反而是那些资源比较多的老手最能吃得开 ,因为他们又有经验 , 技术又没有非常大的革新 ,他们的经验是非常非常宝贵的 ,但像我们这
种新人要去进去做一个产品的话 , 那你就是得从头学起嘛 , 一点一点往上升 , 我是觉得这个非常的无聊 , 我当时只是觉得计算机对于我来说只是一个赚钱的工具 , 它可能只是一个专业的东西嘛 ,但 GPT 我觉得它改变的点就在于所有人都知道这是一个很新很新的东西 ,并且它一定具有一定的价值 , 然后我是觉得它已经超出了我专业理解的那
个可以完成的应用场景的范围 , 所以我是觉得它很有意思 , 我从那个时候就开始一直就是玩 GPT 嘛 , 包括我当时毕设也是跟那个 GPT 挂钩的一些事情 , 从那个时候就开始做那个 prompt engineer, 就天天 hack 它
,也是因为觉得好玩吧 。
这个我其实挺共鸣的 ,因为最近做 AI Hacker House, 然后所有人都问我为什么做 AI Hacker House, 然后一开始其实我也没有想明白 , 就我只是觉得内心有原始冲动 , 然后突然有一天就是我意识到了一个念头 , 就我发现我人生中最美好的时代是 2010 年前后, 我定义那个时代叫做我的五道口年代 , 就是其实刚才陈然在讲说你毕业的时候同学们怎么可以对 GPT 不兴奋 , 我
在我这个读本科的时候也一样的 , 就是你们怎么可以对 Web 2.0 不兴奋 , 就是 Twitter、Facebook 这么好的产品你们怎么都不喜欢用 , 然后同学们主流都是要去这个亚洲研究院微软 , 要去 IBM, 所以其实在学校里面我是很非主流很孤单的 ,但是到了五道口之后能找到同类 , 就是和我一样愿意去个十几人的创业公司 , 愿意把自己这个从早上 10 点到晚上 10 点一周六天
所有的时间全部都放在去 build 我们喜欢用我们自己就喜欢用的产品上面的这样的同类的群体当中, 我觉得得到了非常多的力量 , 这种力量一方面是精神力量 , 就是人认可我 , 就是大家在一起可以就是得到很多的互相的支持 , 然后另一方面就是也有很多启发和眼界的开阔 , 所以意识到这一点之后我发现我想做 AI Hacker House 也有这方面的原因 , 我希望
有一个这样的场域为在 2010 年的 Koji 和在今天的陈然 , 就是我们处在这样的人生阶段的时候的人, 也就是我认为很可能是下一代的 AI 的厉害的创业者们 , 就营造这样一个空间 , 大家可以找到同类 , 可以感觉不孤单 , 可以抱团取暖吧 。
挺类似的这种感觉 。
好 , 又被我植入广告了 。
我前面跟 Koji 也聊说我觉得陈然给我的感觉就是特别的年轻意气风发 。
有吗 ? 我一直会担心比如说很多嘉宾他们说的都比较言之有物嘛 , 然后说实话去年我也是听播客才理解到创业者是在干嘛的 , 我就天天就是通过听播客给自己反思呢 , 听一些创业者的故事 , 然后反正我没想到我这个时候来上了一个播客 。
你刚刚说到寻找跟保护自己的创作欲 , 你有刻意做什么样子的事情来保护它 , 就寻找可能你前面讲到比如说是不停的做一些 Demo, 当然如果有其他的你也可以补充哈 。
我觉得这是我在人生当中思考的最多的问题就是这个 , 我近期好久好久了已经思考了几年就这个问题了 ,因为我的创作欲从我本科毕业之后就消失了 , 我不知道为什么 , 然后我已经过了这么多这么久了吧 , 已经三年了 , 我感觉它还没有回来 , 或者说它到底应该变成什么样子我其实没有那么清楚 , 我其实很久都没有在运营自己的频
道 , 或者说有什么特别想要用视频表达的东西 ,但我知道我想表达 ,但是就是总差那么一点点 , 可能是因为人也变了吧 , 然后我怎么去保护的 , 我现在开始保护的方式就是通过很多物理方式保护 , 一个是我现在选择住在浦东嘛 , 我觉得我还是想住在比较静谧的一点的地方 , 虽然需要社交 ,但我觉得社交那就再去 , 第二个就是我最近开始借一些电子设备
,因为平常工作已经太花时间在电脑上了 , 我甚至有个手机锁 , 会把它锁起来 , 物理上的隔绝手机 , 之前刷视频的时候都刷出工伤了 , 我就再也不想刷视频了 , 抖音真的很毒瘤 , 我就会把它锁起来 , 然后我就看书嘛 , 平常会买一些书 , 看书真的挺有用的 , 就是看书会让你安静下来 , 然后我的可能特点是我需要输入很多东西嘛 , 然后
才能输出 , 所以现在我的阶段可能是在输入的这个阶段 , 然后工作本身也会消耗我一部分创作欲 ,因为我本来也要在 Medeo 当中去创作视频 , 还有创作产品本来也是一种创作欲 ,但是我自己我还没找到它到底在哪 , 我不知道 , 我其实有很多这种半成都不叫半成品吧 ,30% 成型的 idea,因为我的创作我是一个非常敏感的人, 然后我的创作欲大部分的来源都是来
源于痛苦 , 就是当我哭的时候我的创作欲是最高的 , 就很诡异 , 然后我昨天正好我前天正好在坐高铁的时候 , 我就突然那个就来 , 我就哭了一路 , 我不知道我为什么哭 ,但是我会感觉很爽它终于回来了 ,因为我很久没哭了 , 就是我需要那种情感充沛的点 , 然后我也不知道怎么才能制造出来 , 它是一种良性的哭 , 良性的痛苦 , 包括之
前我在本科拍那些片子也是因为当时很痛苦 , 然后我就想把这种痛苦传递给别人, 然后就拍那些片子 。
我想说这不是诡异 , 你看很多那种很有才华的创作者 ,他的创作的高峰期都不是在他很快乐的时候 。
好呀 , 今天谢谢陈然 , 我们聊了 Medeo 这个产品 , 聊了你们团队非常独特的工作方式和一些你们这个非共识 , 我觉得我自己也很有启发 , 然后第二 part 我觉得我相信这个应该也能多多少少给大家一些力量 , 就聊到你的个人成长 , 聊到你的一些生活习惯和工作习惯 , 都很好玩 , 好 , 我们谢谢你的时间 ,也期待你再来十字路口 , 拜拜 。
拜拜 。
拜拜 。
如果你认为有朋友也会喜欢本期十字路口的内容 , 请转发微信推荐给他们 , 最后欢迎你加入十字路口的会员群 , 我们鼓励大家在群里聊天互动交朋友 , 寻找未来的同路人。






