快问快答0:00
欢迎收听 《 十字路口 》, 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会 。《 十字路口 》 是乔布斯对苹果公司的一个比喻 , 形容它站在科技与人文的十字路口 , 伟大的产品往往诞生在这里 。
我们长期观察 AI 创业 , 如果你正在做一件让你自己感到兴奋的事情 , 哪怕它还只是一个想法 , 我们都很愿意听你聊一聊 。
我会认真看每一条留言 。
嗨 , 我是 Koji。 那本周 《 十字路口 》 呢 , 我们第一次尝试了一种新的视频播客的录制方式 。 这一期我们没有坐在桌前对谈 ,而是把整个对话拆成了两个连续的场景 。
第一部分 , 我和嘉宾一起开着理想 MEGA 前往郊区 , 我来开车 ,他坐在副驾 , 我们在车里边开边聊 , 持续了大约一个小时 。
那第二部分呢 , 我们抵达了嘉宾曾经隐居过一年的上海郊区 , 电山湖的旁边 ,在湖中央的一座安静的亭子里面坐下来 , 继续完成了这场对谈 。
那本周的嘉宾是谁呢 ? 他是 AI 视频剪辑工具 ChatCut 的创始人李凯文 ,他过去十年的职业生涯都在做导演 ,而作为导演他非常的厉害 ,他的第一部短片作品 《 孽种 》 就入围了金马奖 。
我现在先自己开车去他们在上海乌鲁木齐中路的办公室接上他 , 然后开车出发 。
李凯文同学 , 导航去淀湖桃园 。
你现在这播客做了多久 ?
做了两年的时间 。
OK。
做了 100 期 。
是那个频率是 ——
一周一期 。
一周一期 ,OK。
对 。 这是我们第一次用这种方式来录 。
不 。
有可能我可以把它拍成某种有趣的系列 , 每次去个不一样的地方 。
这是一个好的一个系列 。 Founders in cars going to places.
对 。 现在已经在开车驶离市中心的路上了 , 我们还是先从快问快答开始 。 请问凯文你的年龄 ?
92 年 。
哇哦 。 你毕业的学校 ?
罗德岛设计学院 。
你的 MBTI 和星座 ?
MBTI 很久之前测过 , 已经不准了 ,不提了 。 然后星座是双鱼座 。
那你自认为自己现在的 MBTI 是什么 ?
INTP。
然后一句话介绍 ChatCut 呢 ?
聊天的方式 , 剪视频 。
融资的情况目前是 ?
大概是千万人民币左右的种子轮 , 刚融完 。
咱们的收入和利润情况呢 ?
不太好透露 。
目前团队的规模呢 ?
10 个人。
一句话介绍一下创业之前在做什么 。
创业之前我是一个广告纪录片导演 , 然后我之前是在 Vice 和 Discovery, 然后 Homer Production 的创始人。 然后 24 年短片 《 金马 》 入围 。
我们现在在开车离开上海的路上嘛 , 我们在这个路上可以聊一聊你的来时路 , 然后等我们到了目的地之后, 我们再来聊 AI,以及聊这个 AI 的产品 ChatCut。
离开市中心2:50
我记得有一次你跟我讲说 , 离开市中心是你人生的一个关键词 , 那是哪一年的关键词啊 ?
22 年、23 年, 那个区间 。 那个时候是我刚就是拍了很多广告和纪录片之后, 然后遇到了上海的比较特殊的那个时期 , 突然有更多的时间去做一些思考 , 就比如说 , 哎 , 我怎么突然拍上广告了呢 ?
嗯 , 所以你怎么突然拍上广告了 ?
16 年底的时候我去了 Vice Media, 被派到了 Vice 的中国 。 然后在美国的时候 , 你做这种媒体 , 你可以通过平台的本身的收益 ,但是在中国 , 就比如说当时是你把你的片子放到爱奇艺上或者优酷或者通讯上面 , 你靠那个流量去给你分钱 , 那个几乎是不可能成立的 。
了解 。
所以说就是在中国就多了一个这个 commercial 部门 。
所以其实你去 Vice 的时候 , 一开始是认为 Vice 是一个就自由表达 、 做自己的内容的地方 ?
对啊 。
然后来了中国之后发现 , 哦 , 这里的商业模式是那样的 。
然后我没觉得那是个问题 。 我是真想着做那个商业项目 。 嗯 ,因为就是你商业项目你是有预算 , 更多的人去配合你做这事 。
就你其实是主动拥抱了商业 。
我彻底的主动的拥抱了商业 。 有一部分是从学习的角度 , 就是我对那个很好奇 , 当那个钱不是问题的时候 , 咱们能有什么样的想法能去拍 。
然后从一个商业的角度 , 就是我觉得就是当时就是大学刚毕业的时候 , 就是假如说是我自己去拍一个短片 , 没有人管你要那个短片 。
对 。
但是你如果说我给 Burger King 拍了一个项目 , 咱们看都不用看 ,但是这小伙好像有两下子 ,Burger King 都找他拍 , 就是给 Adidas 拍过 , 那得是什么样的人。
为什么拍着拍着那两年就想逃离了 ?
广告它有一个实打实的技术的提高 , 还有一部分是这个虚荣的这部分 。 然后当它这个纯虚荣的这部分消除了之后, 我对于做纯广告的那个兴趣没有那么大 。
然后广告是一个非常全面的一个要求 , 你有这个 idea, 同时你又得去说服你的演员和客户和甲方和乙方和乙方的甲方 , 就是乱七八糟 。
我看见了很多人他非常擅长做这事的时候 , 我就明白了每个人的品种不一样 。 我如果去硬去跟别人比那个广告导演的综合素质 , 我觉得未必有一个特别好的一个结果 。
嗯 。 那那个时候想好接下来要做什么了吗 ?
我们现在去的地方也给了我特别大的一个启发 。 就是当时我们也是拍一个项目 , 就是在那个湖旁边 。
OK。
然后我去看景的时候 , 我就是觉得哇哦 , 这太棒了 , 旁边有一个那种中介 。 我就说咱们看一眼 , 就是说可能搬到那不太现实 。
然后去看了一眼 , 然后看中了一个房子 。 有的时候这个不是说你做了一个决定 ,而是说上帝之手在推着你 , 就是觉得哦 that's the one。
一见钟情的房子 。
对 。 我觉得不管怎么样 , 先抽身出来 , 然后咱们再想下一步是什么 。
那个时候开始拍 《 孽种 》 这波后来入围金马奖的短片了吗 ?
那个时候是我开始想要做一个就是属于我自己的一个事 , 它可以是一个片子 , 它可以是一个产品 , 它可以是一个 app。 我这一年我可以我就不接广告 。
然后我就是憋一个招 , 这招具体是什么不知道 ,但是咱们先那个先憋着 , 然后那个让它发芽 。 然后写了很多短片 , 然后 《 孽种 》 是其中的一个 , 然后那一年的时候把它给拍出来了 。
然后其实拍 《 孽种 》 的同时也是 ChatGPT 刚出来的时候 。 所以说就是我生活中开始用很多 AI, 我也同时生成了这个 ChatCut 的这个 idea。
你刚用完 ChatGPT, 然后再开始剪片 , 用 Premiere 能感受到这两个时代的一个交接 。
感觉自己在穿越 。
对对对 ,是在穿越 。
未来世界和远古时代 。
对对对 。 然后我一直在琢磨做 ChatCut 这个事 , 上帝一定会把这事给做了 ,但是这个是不是上帝让我去做这事 , 或者说我要不要把上帝这个活给接下来 。
就是解决一个普通人的问题 , 实际上它听上去既简单又难 , 它不是在于你有多么技艺高超的一个表达 ,而是说就是你对生活里面的问题的一些难但是深入的一些洞察 。
然后在这点上, 相比于一个纯工程师背景的人去做这事 , 就是我觉得我具备一定的这个优势 。 如果让上帝去安排 ,不一定会安排我 ,但是上帝如果还没指出一个谁的话 , 我把手举起来了 。
这中间有哪几个阶段呢 ? 从你萌生想要做这个事情到今天 。
我就开始深入的想这个 app 到底它是一个什么样的一个 app。 就是刚开始的时候是一个 ChatGPT 或者 cursor for video editing,但是它到底是什么意思 , 它落地之后是一个什么样的一个 app。
第一位投资人8:02
然后开始构思 , 然后在金马影展的这个期间遇见了就是 Antler 的这个合伙人 Eric, 新加坡的一个 VC,他会直接说就是已经跟你相处一段时间了 , 然后我给你很小的一笔钱 , 我看看你能用这个做出什么 , 看看你有没有一个就是做一个事的一个毅力 。
而且就是我也很有幸 , 我们遇见的第一个投资人是他就是那种传说中的 empowering figure。
这个怎么讲 ?
就是有很多人他的个人能力非常的强 ,他个人魅力也很强 ,但是你坐在他旁边的时候你会觉得哦 ,他这么强我是非常渺小的 , 我什么都不是 , 我怎么能跟他比呢 。
但是有的人是他个人能力强的前提下 ,他会放大他身边的每个人的能力 。
我记得你曾经说过一个评价 , 就是说你见了很多 VC 投资人, 好多人都是在找你身上不能做成这个事情的原因 ,但是 Eric 一直在试图寻找你能做成他的原因 。
是的 , 完全就是这样 。 找一个事不能成的原因很简单 , 世界上大部分的事都是不能成的 。 如果要找毛病的话 , 就是咱们不用找 。
所以拿到 Antler 的钱之后就开始做 , 然后第一版发出来的时候是顺利的吗 ?
就是当时的这个我们的目标用户是一个相对专业的一个用户 。
专业用户 。
其实 ChatCut 大概的一个思路是这个 , 你把视频通过某种方式去转录成文字 ,因为这来自于就是我们剪辑的这个经验 。
就是很多时候剪辑是发生在这个 Word 文档里面 , 就是剪辑听上去是一个很多模态的一件事 ,但是实际上一个剪辑师在剪辑的时候 , 大部分的工作是以文字为载体 。
所以说 ChatCut 它可能核心有两点 , 一个是用一个巧妙的方式把这个视频转录成文字 , 另外就是 AI 真正产生价值的部分 ,是怎么把这个已经转录成的文字去编排成新的一个剪辑 , 然后通过工程的方式把它映射到这个时间线上 。
然后我们第一版的时候其实只做到了第一个 , 就是我们只是把这个语音做成了转录 , 然后人可以通过编辑文字稿那样的方式去编辑这个视频 ,他甚至都没有 AI 的剪辑的这个功能 。
然后接下来的版本里面 , 就是到了这个 4 月份的时候 , 我们才刚开始有这个 AI 剪辑的这个雏形 。
所以一开始是来不及做是吧 ?
你如果有 1,000 个 true fans,他是那种你出什么他都会用 , 然后每年付你 30 美金 , 你把这件事服务好 , 你其实不需要特别大的去 scale,他更多的是一个 business, 小而美的这个产品 。
当时的时候我们是没有想要做这个能 scale 的这种大 AI VC back startup, 我们就是没有 we're not ready for it。 所以说我们能做到的就是做出一个 MVP, 然后找到你的第一个 customer, 然后你的前 10 个 customer, 你的前 100 个能持续使用你的 app 的人。
当然现在我的观念变了 ,但是当时我觉得是好的学习的经验 。 就比如说你小孩留学去美国 , 你爸最好别一下在你村庄里面一下放个 10 万美金 , 可能一下染上了不良的习惯 。
所以你的意思是穷创业反而让你经历了更多 , 学到了更多 。
别人可能有别人的方法 ,但是对我来说它是特别好的学习的途径 。
嗯 。 哎 , 这让我想到其实你是从辽宁的鞍山 , 然后去美国直接读高中 ,而且在 Kent School, 这个非常好的高中 。
鞍山到RISD11:18
这个是怎么做到的呀 ?
就是我小的时候学习是属于班里面中上点 ,不是一个特别好的学生 ,但是我就是对外界的这个世界特别有好奇心 , 比如说当时的那些电影我就是有一个我就看一个 , 然后音乐有一个我听一个 , 只要是唱的不是中国话的歌 , 我就觉得哎这个听一听 , 然后这个别人能听明白 , 然后我装个歌我能听明白 。
然后我爸也比较支持就是我的这些兴趣爱好 , 就是我爸出差的时候 , 当时有个东西叫打口碟 , 都按斤买 , 就是我爸就直接买一斤回去我就一个一个听 。
我的太开心了 , 每次收到一斤像拆盲盒的快乐 。
对对对 。 那个时候就是它不仅是盲盒 ,而且你拆完了也是盲盒 ,因为就是说这东西不像是说拆完了一看啊涅槃 , 我上网一搜哦这个别人说这个好 ,因为还没有那个 internet, 就是说你整个评价体系都得你自己去构造 , 这个东西好听不好听完全是靠你自己去判断 , 靠你两只眼睛两只耳朵去听 。
然后就是我对外来的这个文化特别好奇 ,以至于我初中的时候就是英语就特别好 , 然后就是当时是 Kent 正好来上海做那种面试招生 。
但他怎么知道你的存在 , 或者你怎么知道 Kent School 来上海了 , 你在鞍山 。
Yeah, 这个就是当时做的一些调研 。
你是已经决定要去美国读高中了 , 所以开始在做这些调研了 。
我想要去美国读高中 。
OK。
然后原因一个是我对外面非常感兴趣 , 然后我看那些美国电影我觉得就是那个就是我的灵魂的所在 。
当然后来并不是完全是我想那样 ,而且我妈是一个高中老师 , 出了名的比较狠的那种 。 我的成绩应该不出问题 , 就是去我妈的那个学校 。
那个时候在鞍山 , 大家去美国读高中, 这仍然是一个极其小众的 。
几乎没有 , 完全没有 。
哇哦 。
我觉得就是我对于新的一个事或者一个新的地方 , 我从那个时候我就一点没有那种就是哦会是什么样 , 我这人生地不熟我会不会遇到就是 it's okay, 就是 let's just try it。
感觉对于风险的承受能力是非常高的 。
人家来上海招生 , 你是感觉自己身上哪些故事或者性格打动了他们 ?
我在初中的时候我开始卖打口碟 , 我首先有这个销售能力 , 另外就是你对一个东西真正你有多热爱这个东西 。
我初中的时候就是热爱音乐 , 热爱到已经就是疯了的地步 。 就是说别人春游的时候都是拿着那种面包饼干什么的 , 就是我就是背我所有的打口碟就是在书包里面 , 然后我就是你在我旁边走 , 我就是耳机塞到你耳朵里面 。
去推销吗 ?
对 , 就是说你听这个 , 就是说你买不买不重要 ,但是就是说你听这个东西 , 你就只有我一个人觉得这个东西好听吗 ?
就是说第一次听到 Beatles, 第一次听到涅槃 , 就是说我觉得这东西太牛逼了 , 然后你听你觉得就是说摔摔你的脑袋 , 你怎么能觉得它不好听呢 ?
这太好听了 。
所以这是非常热情驱动的一个创业 。
这是完全热情驱动的一个创业 。 然后我还记得买到了一个 , 比如说一个 Blink-22 的一个新专辑的一个手板 , 然后这个当时的那打口碟那个就是别人那口都打的巨多 , 然后我那口就打的很薄 , 所以说我那首歌没打掉 。
然后我就给同学打电话说 hey you know what, 我弄到了一个 Blink-22 的一个新专辑的手板 , 然后我现在在电话上我直接就开始给你听一下, 然后我就打开我的 stereo, 然后电话上听 , 我说牛不牛逼 ,50 块钱买不买 , 明天就没了 , 我说那我留俩 。
哇 。
Yeah。
我觉得现在听起来仍然是非常快乐的一段创业 。 那这个很幸福吧 , 就是如果别人不买的话 , 你也自己留着也是一个自己的资产对吧 ?
这个也不会因为卖不掉而苦恼 , 这样的商业模式真的是太爽了 。
其实做一个 startup 就是你成不成功 ,不管个人能力有多强 , 都是上帝去决定了很多的这个因素 。 但是我觉得做一个创业者你能做到的就是说我选择做的这个事是它失败 it's okay, 我们一起做的这个事和一起做这事的人, 即使这个事成功与失败 , 就是我们的过程一定是好的 。
哎 , 那沿着这个路其实你很容易就会走上, 比如说去读个商学院 , 或读个经济 , 或读个计算机对吧 ?
但是你后来去了罗德岛艺术学院 。
我高中在 Kent 的时候我就热爱上了电影 , 当时我有几个电影学院的选择 , 美国它挺好的一点就是它鼓励你去那个 college visit, 然后我去了罗德岛设计学院的时候 , 我觉得就是一下能感觉到这的人太不一样了 , 然后他的那种发型和他的那种穿着和他的那种就是他听的那个东西你没见过 , 然后他看的那些东西你也没看过 , 就是感觉有一种完全来到一个外星球
的一个感觉 。 它是一个特别鼓励那种独立思考的那种地方 , 所以它出的那些 startup founders 都是感觉有灵魂的那种 startup。
哎 ,有哪些啊 , 比如说 ?
比如说那个 Brian Chesky 和 Joe Agebe 的 Airbnb。
Airbnb。
Yeah, 然后 Family Guy,Family Guy 的创始人是 Kent School 和 RISD,是我的 alumni。
这还蛮特别的经历 , 可能找不出第二个鞍山人有和你相近似的经历 。
有一个作家叫 Kurt Vonnegut,他管这个东西叫 dancing lessons from god, 就是我是愿意去 take dancing lessons from god, 然后但是东北实际上它是一个比较保守的一个地方 , 可能是到我这就是出现了一个基因的一个突变 , 然后东北确实很少这种冒险精神的人, 现在越来越少了 。
其实都说导演很像一个片场的 CEO 嘛 ,他要统筹所有的事情 。 那现在你真的创业做 CEO 了 , 你觉得两种 CEO 的角色都当过之后 ,有哪些相同哪些不同 ?
导演vs CEO17:09
我觉得就是有很多相同的一些点 , 就比如说一个导演他是一个综合素质的挑战 , 你对这个世界有一个自己的一个认知 , 然后你有一个 vision,但是你有一个 vision 它只是一个刚开始 , 你作为导演的话你得有能力去吸引到这个资方 , 得有能力去吸引到 crew, 得有能力去吸引到好的演员 , 然后让他们去达成这个 vision, 然后它是一个需要你有很强的这个抗挫折的这个能力 ,以及厚的
这个脸皮 , 然后以及三顾茅庐的一些精神 , 然后最后去 take complete ownership of 这个 vision。 另外我感觉特别相似的点就是导演每次的工作都是从 0 到 1, 每个片就是全新的一个片 。
It's always day one。
It's always day one, 我都是要很快的进入到这个舒适区之外的一个环境里面 , 完全从 0 把它到 1 给做出来 , 这个是一个极其高度相似的和这个创业 。
不相同的地方呢 ?
我觉得最大的不相同是这个 , 一个影片拍出来的时候这个东西它就不动了 ,但是一个 app 产品发售的那一天 , 你实际上你才刚刚开始这个你要去打造这个东西最终的它是什么模样 , 需要一个很大的一个思维模式上的一个转变 。
刚才说的其实是作品的角度 , 从管理的角度 , 或者就从经营一家公司 ,因为做电影其实你也在经营一家临时组建起来的一个组织 , 这个又有哪些相同不同吗 ?
我觉得就是电影的组织是一个纯只筛选不培养的一个合作方式 。 广告公司在选导演的时候 ,他得做过 , 比如说我们要拍车广告 , 这个导演得是之前拍过 5 个一模一样的车广告 , 这人我们才会考虑这个 ,因为就是这个事容不得一毫秒的闪失 , 与其一个公司它更像是一个 SWAT team, 就是拍电影它是一个那个 。
特工队 。
对 , 一个特工队 , 然后特工队里面它不是一个那种很理想主义的 , 就是说哦咱们 talk about ideas, 就是当然 you talk about ideas,但是你在拍片的时候它就是一个军事行动 , 做决定的时候需要一些独裁的一些就是我们不商量了我们这么做了 。
然后作为 startup 的话 , 对人要有一个更长期的态度 , 你要做一个真正的一个好的一个 startup 的话 , 你应该对人更像是一种投资 。
你会觉得做电影导演的这种独裁感更强吗 ?versus 做一个 startup 的 , 你会怎么看这种不同的管理风格 ?
我觉得导演他可能看上去是一个非常独裁的一个角色 ,但是其实任何那个好的一个管理者独裁这个事它就不 work, 就是这个是不管是这个公司运营还是这个更大层面的这个独裁 , 都事实已经证明了 , 它的原因是很明显的 , 你如果能找到跟你一路的人, 然后激发别人的这个能力 , 然后 10 个人聚力去做一件事 , 肯定是要远远大于一个天才 ,但是他是一个独裁的一个
人。
所以你是什么风格的一个管理者呀 ?
我一直把自己当成一个我是那个铺马路的那个人, 然后大伙来的时候就是非常的顺利 , 然后大伙有完全一致的认知 , 对这个片子有非常清晰的这个预判 , 然后把这事能顺利的完成 , 然后一个 CEO, 我觉得我真正的工作是给大伙把这个板油马路铺的特别特别平 。
那你们公司的目标是谁定的 ?
我们的公司目标这个是我们可以是一块去商量 , 我跟现在的这个产品同学 , 我们的现在的合伙人, 然后他是有大厂的这个经验 , 特种兵的那种方法论 , 然后加上我的一些直觉上的一些判断 , 我们是一个完全互补的 , 然后我们会自己去立一个这个目标 , 然后我们去完成这个 。
你从一个非科技行业的从业者 , 现在做了一个 AI startup, 今天很多人在自己的行业里面 ,他也有一种受困于此的感受 , 这种困顿感呢 , 大家想去突破它 , 你会有什么样的建议吗 ?
就怎么离开那种困顿 ?
我觉得就是事都不是说出来的 , 然后也不是学出来的 , 都是做出来的 。 就是现在 AI 的 coding 的一个好处就是你没有什么借口 , 就是说我不去做一个事 , 就是现在迈出第一步是很简单的 。
融资故事21:33
我们刚才聊到你拿了 Antler 的钱 , 做出了第一版 MVP 的产品 , 然后后来是真格投了 ,是刘元力的的一个投资 , 所以你和刘元在接触的过程中有一些什么样的故事吗 ?
就是当时没有任何的 marketing 的情况下, 已经有很多付费用户了 , 下一个 slope 是一下要远高于现在这个阶段 , 你要做那个就是真正的需要一个 VC backed startup, 然后我那个时候开始回国开始融资 , 然后我那一个月就是什么都没干 , 然后就是一个一个见投资人, 我就像那个 GPT 一样 , 我得到了深刻的强化学习 , 然后这个在中间的那个期间遇到了刘元 , 我觉得上帝之手就是把
我们俩放到了一起 , 就是说中国这么大这么多投资人, 就是 out of all the investors,out of all the startup founders,we were able to meet, 就是他是一个特别喜欢电影的一个人, 做这个 AI startup 它需要很多理性 ,但是同时也需要很多感性 ,有的时候你看数据看多的时候 , 你的感性的那一面会被逐渐的消除掉 , 能保持自己的感性 , 能保持自己对这个世界的这个天真的一个看法的人是非常少的 , 刘元他是具备真
正的感性 , 然后具备真正的一个好奇 , 给我印象最深的是就是我们聊了很多电影 , 然后我一开始以为他只是把我放到一个温水里面 , 然后最后要怎么着去煮我 , 然后我也给他推荐了很多电影 ,但是他凌晨 2 点的时候会说哎凯文我看了你给我发的那电影 ,他是真的好奇 , 然后我觉得就是我觉得这个非常少有 。
那对电影的共同好奇 , 怎么就导到这个投资的发生 , 或者就你们对事业上的这种共同的追求和彼此的认可 ?
他真的是在试图就是完完全全的了解我 , 然后他在建造一个我的一个模型 , 然后在未来能对我做出一个对未来的一个判断 , 然后他不喜欢正确的答案 , 我们也没跟他聊过这个 ,但是我觉得就是假如说有一个就是 A B, 然后这个就像赌马一样 , 这个 A 是 70% 的胜率 , 然后 B 是 30% 的胜率 , 然后这个理智的情况下就是大伙可能都选 A,但是你即使这种情况
下你即使对了 , 你也不会从中得到特别多的满足感 , 得是你做了一个特殊的一个选择 , 然后你对了 ,但是大多数人都错了 , 这个时候你才会就是得到更多的满足感 , 就是在这一点上刘元跟我是我们俩就是一模一样的 , 就是做了一个对的事可能就是 it's okay it's fine,但是如果说做了事给别人打脸了就是 that's even better。
都在追求各种体验 。
Yeah yeah。
哎你刚才讲说你在这个建了非常多 VC 之后, 有一个强化学习的模型 , 那有什么 tips 可以给到其他还在创业的 , 还在融资的 founders 吗 ?
首先放平自己的心态 , 你不管怎么样你没法练出一套完美的话术 , 就是说你每个都中这事不存在 , 然后世界上有很多 VC, 然后你要找到的是跟你能有化学反应的一个 VC,因为投资不是一个一次性的一个事 ,不是说投完了人就走了 ,而是说就是大伙会在同一条船上待很久 ,有点像一个长期关系的开始 。
对 , 它是一个长期关系的开始 , 然后这个事情发展那个线不是这个哎我一点点接近了哎最后融了 ,而是说就是它发生之前都看上去都是不可能的 , 所以说就是面对拒绝 , 然后去聊下一个 , 它不是所有的事都能得出一套方法论的 , 你就是得不断的尝试 , 那试这个试这个试那个 , 然后有一个零了 , 它也没有什么特别可复刻的原因 , 就是天时
地利人和 , 然后这事就成了 , 然后这个天时地利人没和就是就不行了 。
湖边生活25:11
哇这里好美啊 。
Yeah, 这个像一个咱们拍戏 , 当时我拍片看景的时候就看到这个 , 这是一个湖但是它巨大 。
是 , 大到有点像一片海 。
Yeah yeah。
太棒了 。
Yeah。 我开始做 ChatCut 之后, 就是我高中的学校是一个就我同学都很有钱 ,以前都是我特别羡慕他们 ,但是我开始做 ChatCut 之后, 我跟他讲我做的这事的时候 , 我第一次就是我能感受到就是有钱人对我的羡慕 , 就是你一个人有事做 , 那个是你最大的财富 。
同意 。
Yeah yeah。
我人生最痛苦的一个时间是 14 年 15 年, 那个时候剧美上市了 , 那一年我应该 29 岁 , 然后也有了一笔钱 , 然后我就裸辞了 , 然后就去美国就住在我一个朋友家里 ,他当时就已经买了一个湖景房 , 然后但他白天要去上班 , 然后他上班之后我就自己在他的湖景房三面环湖的客厅的白色大沙发上躺着 , 然后第一天心情非常好 , 然后还自己换上装备出去
绕着湖跑步 , 然后第二天第三天 , 然后到第四天的时候就觉得我第一次感觉到了抑郁 , 是一种什么情绪 , 我觉得摸手机没人找我 , 再摸手机还没人找我 , 就这个世界好像就是离我远去了 ,也没有人在 care 我 , 我也不知道这个我还能和谁发生什么样的联系 , 那个真是巨大的痛苦 , 然后我就知道了从此以后必须要找事情干 , 就是躺着根本就不
快乐 。
Yeah yeah yeah。
所以当时在这里住了几个月啊这一片 ?
住了一年 。
哦整整一年 。
Yeah。
春夏秋冬四季都经历了 。
Yeah。
哎住在这里的时候生活方式是什么 ?
当时有个车 , 然后每两周去一次山姆买所有的吃的东西 , 然后当时对健康就是比较有意识的 , 我每天得多走路 , 然后我得 work out, 当时还开始做一个事就是冥想 。
那一年的开头和结尾 , 你觉得你自己有什么变化吗 ?
我觉得那一年开头结尾我就完全不是一个人了已经 , 就是之前是一个上海的广告纪录片导演 , 经过那一年就是我觉得可以摆脱那个身份以及任何一个身份 , 自己就是有更强的这个定力 。
你当时做导演的时候一天的酬劳是多少 ?
一天 10 万块钱 。
哇 。
然后那个就是 normal life,you know, 就是 I show up it's like,但是我觉得导演是一个没有杠杆的 business。
你是用时间换钱 。
Yeah yeah yeah。 有了 ChatCut 这个 idea 之后觉得就是哇这个东西它是有强烈的杠杆 ,但是同时就是我仍然是在做我喜欢做的事 。
所以做到现在这个 ChatCut 的多数的过程你还是是享受的 ?
嗯它就是就有一本书叫那个 The Man's Search for Meaning, 就是挺有名的那本书 , 就是你过程享受和痛苦是不矛盾的 , 就是它更多的是在于就是你做的这个事你有没有 belief 和你根本上觉得它有没有价值 , 你如果觉得你的这个东西是有价值的话 , 你其实越难受最后你是越享受的 , 它是成正比的 。
对越难受感觉到越享受 。
它就像电影一样 ,不经历 9981 难直接哎西天到了咱们取经吧 , 那个就不好玩那个电影 。
所以你其实在期待着一些磨难 。
影视真的是一个纯高强度的压力测试 , 就是那个片场你能发生的事就真的是就是每天你很难去想象就是它在你日常生活里面去发生 , 然后现在对于我来说就是从别的角度不说 ,但是就从这个抗压的角度 , 就是说磨难发生在我身上的这个 , 就是没有什么能触碰到我 。
所谓的观光难过然后观光过 。
Yeah yeah yeah。
然后就开始也更自信自己可以解决很多问题 。
Yeah yeah。 甚至是说这个观光难过的假设还是说就是你为的是观后面的那个东西 ,但是 that's the job,而不是说为了后面那个东西 , 就是如果这个观光难过不存在就是说 I have no job。
哈哈哈 。 很有意思 。
The obstacle is the way。 就是有一本书叫这个 。
障碍本身难关本身 , 它就是一种生活方式 , 它就是道路本身 。
对对对 。
当时做导演的时候拍片的时候你遇到的最大的难关是什么 ?
这个还真没有哪个是就是单一的一个巨大的难关 , 就是 everything goes wrong,而且这个我感觉就是也是跟那观光难过一样 ,everything goes wrong 的假设是 it's supposed to goright,但是我的心态是 nothing's supposed to goright, 就是 of course it goes wrong,that's the job。
我们现在终于到了湖边 , 这就是你经常会来的一个地方吗 ?
是的 。
你一般在什么样的情景会来到这个湖的中间的这个亭子 ?
之前就是住在后面的一个小房子里面 , 然后早晨可能就是第一件事可能就来了 。
我们再来聊一下 ChatCut 啊 。
ChatCut愿景30:03
Yeah。
其实 ChatCut 在做的一个事情是说用自然语言去帮助做视频的编辑 ,有人觉得这是一个一定会发生的未来 ,但也有些人认为它可能永远不会发生 , 就我理解你肯定是相信它一定会发生 , 所以你才选择做这个事情 。
那你在想到它的时候 , 现在脑海里面有一个什么样的图景吗 ? 你现在有办法把它描绘出来吗 ?
我觉得它不是一定在未来会要发生 , 我觉得在过去视频就是这么剪出来的 , 就是你可能视频是一个剪辑师在 Premiere 里面的操作剪出来的一个东西 ,但是视频都是通过聊天的方式 , 客户拿着一个微信说这个你这镜头给我放这 , 你这镜头给我放那 , 都是通过聊天的方式去剪出来的 , 当然你如果说特别细活的时候 , 存不存在那种情况就是说我就要把这个东
西挪一帧 , 然后我其实手挪一下比我用聊天我还得说半天 , 然后它还给我挪错了 , 就是这种情况是可能的 , 比如说我们现在这一大段采访 , 然后扔到 ChatCut 里面 , 它可以你可以说刚才提到了这几个点是不要提的 , 然后我记得当时说的这句话是很好的放到最前面 , 然后帮我加上合适的音乐 , 帮我加上合适的这个 MG 的这个动画 , 你可以说
这样一句话 , 然后它可以帮你剪出一个大致的一个效果 , 然后我觉得未来它的这个 app 的形态 , 我觉得有些事不用去有天翻地覆的表象上的变化 , 就比如说剪辑器是一个被解决过的问题 , 就是 Premiere、Final Cut、 达芬奇甚至剪映 , 它在编辑器这方面是 99% 的重合度 ,但是高度相似的 ,因为就是经过时代的打磨 , 这个轮子就是圆的 。
那你不打算重复造一个轮子了 ?
我觉得造一个轮子没有特别大的价值 。
如果说我们这个愿景是要做一个自然语言的视频编辑器 , 那这个中间你觉得会经过几个步骤 , 它们分别是什么步骤 ?
Yeah。 就是你不用去完全造这个轮子 ,但是你不得不经历这个轮子造的这个过程 ,因为你没法拿着 Premiere 来做你的这个底层去直接在 Premiere 里面去改 , 你可以做插件 ,但是那个东西它是有很你受制于人, 这个轮子不同程度上你要去做 ,但是最核心的这个部分就是 AI 还是这个抽象的这个部分 , 就是怎么去帮助这个人去做一个剪辑助理的一个工作 , 就是它得掌握的
是这个剪辑的一些真正的工作流里面的一些流程 ,而不是说在页面上有一些所谓的这个创新 ,AI 其实更主要的解决的是在这个功能 ,也就是说剪辑编辑器之上的一个层面 , 它是一个思维的一个层面 ,ChatCut 经历的是一个这个 AI 在它是一个小学生 ,但是下一步的工作是这个把这个小学生送到读高中读大学 , 然后让它对这个世界有自己的一个判断 , 就是你素材扔进去的时候它可能不
用等着你指哪打哪 ,而是说一看见素材明白了 , 然后我给你讲讲这个东西怎么做 , 然后我给你剪出一个高于你的这个水平的一个视频 。
所以第一步你现在在做的还是要再造一个编辑器吗 ?
第一步就是我们的工作 , 它可能是一个比较平衡的发展 ,有这编辑器的成分 , 然后有这个 AI 的这个成分 , 它是一个比较平衡的一个发展 , 它不是说咱们造出一个编辑器 , 然后咱们编辑器造完之后哎轮到 AI 了咱们去开发那个 AI。
所以在过去的这一年多做 ChatCut 的过程中, 就你思考最多的问题是什么问题啊 ?
核心的问题可能是这个风格化的这个东西 , 风格到底来自于什么 ?
这个风格指的是影片的风格还是 ?
就是影片的风格 。
OK。
你在看一个人剪辑的时候 , 就是剪辑有两个层面 , 就是一个是涉及到对错的这个东西 , 就比如说你中间说一句话把这话没说完卡掉了 , 这就错了 , 我让你剪掉 cursor, 然后我看 cursor 没剪掉你错了 ,但是你如果是在解决了这些基础的问题之后, 就是说它已经没有对错的这个东西的时候 , 比如说这个每个 Youtuber 或者说每个自媒体现在有很强烈的自己的
个人风格 , 整个剪辑的过程里面就要理解这个风格化 , 你怎么去用 AI 去复刻这个风格化这个东西 , 我觉得这个是一个现在还在探讨没有人有答案的一个东西 。
我理解这个难是难在它很难有强化学习所需要的那种反馈闭环 , 那 AI coding 之所以能够那么快的发展是因为有 bug, 它就是有 bug, 所以这个是很容易这个拿到强化学习的反馈的 ,但是怎么让一个片子好看 , 这个非常的主观非常的风格化 , 那在你思考这个问题的过程中你觉得它有可能是通过什么方式去解决吗 ?
就比如说我在剪 Vice 的片子的时候 , 我在剪 Discovery 的片子的时候 , 就是我的思路不是说 OK 李凯文来了 , 咱们拿出自己的风格 , 就是咱们剪一下 ,而是说你 follow 一个 process, 你遵循自己的一个流程 , 然后因为我用这样的一个流程 , 然后我每次就是我不把我的 ego 放在里面 ,而是说就是这个素材量很多 ,但是没事我们先看采访 , 然后这采访也很多听起来也很难去
记住这些每一个点 , 我们先有一个 word 文档 , 所以说刚才提到这个为什么剪辑很多都是文本上的工作 , 所以说就是每次我 follow 这样的一个 workflow, 它最后导致了我形成了这样的风格 ,也就是说它不是一个 A 点到 B 点的一个问题 , 所以说你如果用这个传统工程的那个思维说就是这是 A 这是 B, 咱们强化学习大力出奇迹 , 这个就是中国那个武侠小说里面走火入魔写
的东西就是这个 , 就是硬来了 , 你没找到这个问题的关键 ,但是你如果这个观察着它在刚开始在做这一步的时候它用了一个这样的一个技巧 , 所以它最后成品是这样的 , 它会帮助你自然的形成一个风格 。
那这个要怎么去变成 ChatCut 的一种能力呢 ?
下一步的工作就是我需要把真实的剪辑师的工作流做成不同的 agent 的工作流 , 然后去观察他们在不同的语境下不同的素材里面不同的这个表现 , 很多东西需要人去给定义的 , 就是因为我觉得你说的是完全正确的 , 剪辑有很多是就是人类的 common sense, 它没有内化在这个 LLM 的这个训练数据里面 , 所以说有一些工作流它先做什么后做什么 , 这些小的这些 checklist 像这
些细节实际上它很大一部分决定了这个成片是什么样 。
今天做 AI 视频的这个工具蛮多的 , 大家有不同的这个路径 ,但这里面有很多关键的选择 , 比如说一个关键的选择是用什么模型 , 然后另一个关键的选择是我给用户多少的自由度 , 我要不要做 workflow, 我要不要用生成的画面还是我就是原教旨的只用用户拍摄的画面 , 就是在这一系列的各种关键选择里面 , 就可不可以讲一讲你认为自己已经做出了哪
些就是非常清晰的你自己很笃定的选择 ?
目标用户37:08
我们的目标就像 1+1=2 一样清晰 , 原因就是我们自己就是用户 , 那有的时候它的这个问题提出的时候可以直接想一下现实生活中每天在拍东西在创作的这些人他们的需求是什么 , 我觉得就是 AI 生成视频没有给真实的世界带来特别大的影响 , 就比如说你坐在飞机里面你看前面那人看的是什么 , 然后你在地铁里面看见一个人在刷抖音他刷到
的是什么 , 然后这些视频是怎么剪的一点都没变 , 那些视频是怎么出来的一点都没变 , 所以说它就是这世界它是矛盾的 ,有的东西看上去每天都在天翻地覆每天都在革命 ,但是有些事就是就像我们坐在这湖边就是这个一点也没变的 , 我们的 AI 就是我们一直把它比作成它是一个蓝领 , 世界上最接地气的一个 AI 解决的就是最真实的创作者的工作
流 , 假如说这个工作流里面你解决一个问题你解决好了就是 that's a billion dollar business, 比如说 Frame.io 那就是一个好的一个 product, 它就是做那个视频 review 就是那个审片 , 这是多 niche 的一个 market,但是就是 multi-billion dollar company,因为它不那么 sexy 的解决了真实世界的一个真实的一个问题 。
那也有另外一个观点就是认为其实视频剪辑这个里头是环环相扣的 , 你刚才举例的这个审片它其实不在剪辑的这个工作流里面 , 剪辑因为它环环相扣 ,因此大家会很谨慎的去改变自己的剪辑的工作流 , 就是你做到现在你有看到有哪些苗头吗 ?
会在什么样的剪辑的环节因为 AI 的出现产生什么样的可能的改变 ?
我觉得就是你的这个评估完全是在我们的这个现实中也得到了验证 , 就是一个专业的剪辑师你很难去触动他的这个工作流 , 之前我们 target 很多那种专业的剪辑师 , 然后这也是我们改变了我们的 target 的一方面原因 , 就是我们意识到了这个生态系统的庞大 , 我没法造出一个 Premiere, 然后我们在 Premiere 上面加一个 AI 这肯定是做不到了 。
所以你们改变了这个对目标用户群的定义 ?
对 ,因为你轮胎跟地表接触的时候你都醒悟了 , 现在对我来说最 exciting 的是就是我们的用户他可能之前都不是剪辑师 , 就比如说他是一个一直想要做内容起号的那么一个自媒体的人, 然后他之前觉得就是做一个内容就是剪辑一直是他不做这事的一个原因 。
太难了 。
现在拍摄它特别简单 , 你拿出一个就是手机去拍画面就是不比这些相机差 ,但是就是剪辑就是最重要的一个卡点 , 然后我觉得就是解决他们的这个能一下让他们达到一个 80 分 , 我们给这些人提供了巨大的价值 , 甚至比就是让专业的剪辑师提高工作效率 1.3 倍我觉得那个要更有价值 。
你可以在这里举一个具体的例子吗 ? 就是比如说刚才提到的这样新的这些目标用户 ,他们因为有了 ChatCut 他们现在剪出了什么样的新片子 ?
就是比如说别的 AI 的视频的 app 这个东西是用哪个出来的一看你就知道这是 Google Veo, 这是 Kling, 这里面有水肯定是即梦 , 然后这是漫画风格肯定是什么什么什么 ,但是用 ChatCut 剪出来的片你完全看不来它是没有 AI 痕迹的 ,因为它就是只触碰剪辑 , 我们不生成任何的像素 , 它只生成上面那动画就跟你用 AE 去做那个 MG 动画是一模一样的 , 所以说就是
我们用户群里面发现了那些视频天差地别就什么样的都有 , 就比如说有一个老师他就发现哎我如果直接就是把我那些课件或者那些大纲我直接扔进去做成一个一个的 MG 动画 , 然后我再录一段自己的视频 , 然后再就是用那个 ChatCut 剪一下我直接就能做成我的一个自媒体的一个账号 , 然后我们会有那种房地产的那种视频 ,他现在就是直接就是能自己
去做这东西 。
我看到另外一种路径啊 , 它和你们的目标用户是一致的 , 就是我不要去服务最专业的用户 , 最专业的用户在 Premiere 里面他们过得好好的 , 我就想去服务那些想用视频表达但今天还没有能力的人, 那这样的人群是广泛的 , 那有一些产品的做法他们是帮这些用户去生成视频 , 然后再用生成的视频去剪辑出一个完整的片子 ,因为这背后有一个假
设就是用户要自己再去拍东西 , 这个是困难的 ,因为拍摄本身虽然工具很简单 ,但是视觉语言的表达很困难 ,因此他就只需要用户有 idea 就好 ,他把这个 idea 翻译成视觉再生成出视觉最后组合成片子 ,但这个显然不是你们选择的路 。
它的这个就是我们对未来很显然就是有一个不同的一个认知和一个判断 , 就是我觉得视频它根本存在的一个原因是什么 , 就是它是一个人之间交流的一个东西 ,但是你如果说里面完全内容是不跟现实世界相关的话你很难去感染一个人, 就比如说你录了一个很糙的一个视频但是这个视频是你一个真人对一个观众讲一个故事 , 它能引发的一些东西不是说它不专业能掩盖的 ,但
是这个人是具备生命力的 ,AI 能取代很多东西但是我觉得它取代不了这个这个最核心的这个东西 , 我觉得就是做生成它一定是一个创作手段之一 , 它是一个艺术的手法之一 ,但是我觉得你如果是生成那个东西可以代替别人的拍摄那个就是对世界的一个错误的一个判断 。
技术突破42:38
你觉得可以有部分的生成 ,但是不能是全部的生成 ,因为全部的生成没有世界的真实的样子它很难打动人, 今天虽然 AI 做了很多突破但还是有很多做不到的事情 , 那从此刻到如果有一天真的一个自然语言去做视频剪辑的那个 ChatCut 它诞生了 , 你觉得这中间还有哪些技术上做不到的事情需要去逐一突破 ?
就是首先这个上下文的这个 limit, 那个叫什么上下文的这个限制这个是一定要突破 ,因为视频是一个消耗大量 token 的一个东西 , 然后现在的这个上下文的 limit 是一个问题 , 然后就是多模态的这个发展 , 就是实际上多模态现在还没有一个真正意义上的一个就是特别成熟的一个多模态的一个模型 , 然后 Google 是对这个 Gemini 算是一个好的一个开头 , 然后它对这个音频和里面说的
话有个大概的一个理解 ,但是它还没精准到就是能去做剪辑的这个程度 , 然后我觉得就是这个多模态和这个上下文会是一个比较大的一个突破 。
就今天 Cursor 之所以成立是因为背后有非常多的这个代码 , 这个是它训练的材料 ,但是要去做一个比如说 cursor for video editing 就我们在做的事情 , 那背后没有那么多的开源的代码 ,因为视频剪辑它对应的这些全是在脑海里面的知识 , 那没有这些知识没有这些东西你要怎么去训练一个 AI 它可以很好的去帮人完成剪辑的工作呢 ?
你们现在是一个什么样的思路要去完成这件事情 ?
就是剪辑它没有那么多的代码不是因为剪辑要比代码要难 ,而是说剪辑它更多的是就是很多 common sense 的这个东西在里面 , 然后 common sense 是 LLM 本身就具备的一个东西 , 那个是一个前提 , 然后另外的话就是我觉得剪辑还是得就是分成两块去提高 , 一个是能验证的指哪打哪那些东西 , 比如说我要剪口误我你没剪完然后我要那个做成一个抖音风格的一个东
西 , 它有没有给我变成竖屏 16:9, 就是有一些东西是能验证的 , 然后有一些东西确实是好与坏什么的那种 , 我觉得如果是做到第一个程度的时候它其实就已经提供巨大的价值了 , 就假如说你能指哪打哪的那一天就是你话稍微说清楚一点或者说你要什么你稍微说清楚一点 , 我觉得它就是能提供巨大价值 , 然后另外就是我们也得去就是通过这
个我们自己的平台去收集这些信息 , 然后一个是调优我们的 prompt, 然后一个是我不敢说应不应该这个事是不是一个训练一个模型能出现的一个事 ,但是我觉得没有那些代码 that's true,但是我们自己做一个平台的一个优势第一个我们去积攒这些信息 。
我觉得现在还在挑战一个非常难的事情 , 你来的路上其实我们有在聊嘛 , 觉得这个事情是上帝一定会选一个人来做 ,因为它一定会发生 , 你之前在看谁会去接上帝这个活 , 哎好像没有人接 , 然后你接了 , 那为什么没有人接呢 ?
这是一个 wow interesting。
因为其实有两种创业的状态是不一样的 , 一种是我在做的事情有一万个人都在做 , 另外一个事情是我在做的事情没别的人在做 , 然后好像你在后者 ,但这两种它各有各的这个好与不好 。
我觉得就是我们也不完全是在后者 , 我觉得就是它是这个很多人觉得我们在前者甚至可以这么说 , 然后很多创业者也会觉得自己在前者也把我们归类为前者 ,但是我为什么说就是上帝这个活没人去接 , 它的原因是这个你能锁定这个一个方向和找到一个东西的一个切入点和一个好的一个方法论是一个非常难的一件事 , 这个切入点是一个非常细腻的一件事
, 然后它有的时候不是需要你一个特别天才特别划时代的一个想法 , 它通常都是 yeah this works 就是我需要的是这个 , 它是一个很简单的一个认知 level 的一个东西 , 然后我觉得就是恰巧我的纪录片的背景在这方面起到了一个特别大的一个作用 ,而说纪录片它是算在这个东西叫 unscripted 就是没剧本的创作里面 , 它包括就是现在我们几乎讨论的一切的 content creation, 就比如说你是一个 Youtuber 你是在做一个
unscripted, 与 unscripted 相反的那个是 scripted content 那是电影的那种创作 , 就是有一个严格意义上的一个脚本 , 然后你剪辑的时候需要解决的问题不是说我选哪句话我怎么样去筛选内容我怎么样去找到逻辑 ,而是说这个逻辑已经是铁打的了但是我怎么找到这句话的最好的表演我们怎么找到这句话这个 scene 这个 scene 的逻辑已经定死了我们怎么能去切机位找到最好的
呢 , 那个我觉得是 AI 不要去碰也解决不了的一个问题 , 就是梁朝伟对张曼玉说我有个船票你会不会跟我走他有 100 个 take 你让 AI 去给你选就是 forget it cannot be done, 然后在 unscripted 这个层面里面就是纪录片是最难的因为它是素材量是巨大的而且它的目标是最盲目的 , 你王兵你拍了就是铁骑驹拍了三年你要剪三年最后剪成三小时你不是说带着脑海
里的一个印象然后最后要剪成我脑海里那个东西 , 你是完全要面对自己每天的这个拍摄然后去有机的形成一个有生命力的一个东西 ,但是你找到了这个东西之后它的工作流是完完全全复刻在你拍抖音也是一模一样的 ,因为它是不同程度的一个问题 , 比如说你拍抖音我去长边山滑雪拍了一堆 random 的这个东西你在一个比较低的一个程度上你是在解决王兵纪录片导演解
决的同样的问题就是一个无序的一个素材里面我们怎么去找到这个规则这些规则里面可能有三条可能性的规则但是这个是我觉得最吸引眼球的 , 所以说就是非常巧我在 AI 出现之前就是在做大量的这个央视探索频道 Vice 的这些纪录片 , 所以我对这个混沌 chaos 虚无的这个宇宙 I've seen that 然后我从中得到的这个东西它恰巧它是现在的一个内容 content creation 增长
的一个最大的一个趋势 , 就是自媒体 Youtuber 其实都是纪录片就是我们现在在做的你可以觉得我们在做一个 podcast 但是我 it's a documentary, 然后另外就是我当时迈出这一步的时候是在一个特别好的一个时机 , 它是 LLM 已经出现了一到两年但是 AI coding 才刚刚出现 , 然后也就是说就是刚才提到 Antler 给我的最大的一个影响就是 Antler 它因为是第一个投 lovable 的公司所以说我们有无限量的 lovable credit, 然后我
能在一个就是刚开始的时候就是说 okay 有一个 lovable 那我 vibe 吧这个就是还等啥呢呀 ,但是我现在想起来就是在那个时候你开始 vibe 一个东西现在能有一定的起色它相比于你现在说哦我也想要有一个这个 ChatCut 这样一个想法然后我现在开始去搭建这个团队就是我觉得这时机稍微有点晚了 , 这世界没有停滞不前它有我然后有其他的像我这样的人在 。
被你把这个坑给占住了 。
我的这个萝卜已经扔那坑里了然后你也可以硬塞一个萝卜进去但是就是 life is not gonna be easy for you。
那像你刚才提到的之前做纪录片比如说拍了三年的素材最后要把它整理成三个小时的有完整的生命力的一个故事的叙事线 , 那这个其实是有一些 know how 有一些方法在自己的肌肉里面 , 那你是怎么把这些方法落到 ChatCut 的这个产品上面表现成一些功能一些它今天大家看到的 feature 的 。
有一种 self-help 的一个理论就是说一个人他做的一年之内会取得什么样的成绩不在于他给自己列了什么样的目标而是在于他养成了什么样的习惯 , 然后我觉得这个在 AI agent 里面就是它是一个被低估的一个方法 , 就是有很多人觉得这个 AI 它是一个应该是这是原素材这是结果或者说这是 context 这是我要的结果然后它应该有一个特别线性的一个连接 ,但是实际上可能很难去
让一个就是很多人理解的是这个问题有很多不同的对的答案 , 我在剪片的时候它有太多的机缘巧合的成分在里面 , 我可以这么剪我找素材之后一看到这个哎我没在找这个但是哎我看见这个就是放这 it works 它没有什么绝对的对与错 , 所以说就是你如果用 AI 去找一个绝对的对与错的话它永远都会是错的你只能去给它养成一个好的一个习惯就是
当你这个地方有缺失的时候你要去看素材然后当你的这个故事发展到这的时候你一定要去找一个这样的一个 sound byte 然后你在这个 scene 的转场的时候你要尽全力的去找一个 transition 这样的一些点而不是说这原素材这好的剪辑我给你十万个样本 , 我觉得还是找到一些细微的点然后细微的点决定了宏观的它的样子 。
你是非常原教旨的自然语言剪辑派吗 ? 比如说也有人会认为我自然语言可能只能解决一半的问题甚至更少的问题 ,其实还是有很多的这个剪辑是需要用拖动用划拽之类的去完成 。
我觉得这个是我们在找到的一个平衡 , 就是从原则上来说剪辑一定是一个人机互动的一个事 , 就是 AI 它的再强我看不到它有一天能完全取代一个人, 所以说在 ChatCut 里面时间线的编辑其实是一个比较重要的一个功能 , 然后我们的那个文字的那个编辑也是一个花了很长时间去做那个东西 , 所以说从原则上来说肯定不是百分之百的依赖这个 AI 能去达成所有
的那个剪辑 , 甚至我觉得就是假如说 AI 能达到 80% 但是给人空间去改相比于 AI 达到 90% 但是你人改不了了我宁可去要那个 80%。
从你们做 ChatCut 开始到现在其实模型也经历了非常多的发展 , 然后你有感觉到就最近这一两年的哪些突破对你们的帮助最大的 ?
不管是多模态还是 LLM。
我觉得就是分成两个部分 , 一个是对于产品的这个帮助 , 就是在产品这方面就是 Gemini 2.5 出来的时候对我们的产品是一个巨大的一个帮助 , 然后这次 3.0 对我们来说也是一个巨大的一个帮助 。
可以分别讲讲这帮助是什么 ?
之前比如说你用 Claude 或者 GPT 那种模型它的那个上下文长度就是不够 , 比如说你半小时的视频可能就已经不要上下文了 , 然后现在 Gemini 的话就是它 one million token 甚至是两个 million token, 就是之前可能做视频剪辑第一个想到的事得是哦你得去做一个 RAG 得去做一个 vector database 因为你第一个要解决的就是上下文的这个问题 ,但是现在实际上其实先不用去解决这个问题 ,
然后另外就是我们的这个 MG 动画的功能它很大一部分程度就是因为 3.0 的那个 。
才成立的 。
才成立的 , 所以说 MG 动画我们其实也做生成式的那个 AI, 跟别人不一样的是我们不生成像素 , 就是我觉得生成像素那个是 where I draw the line, 我们生成代码的方式 , 然后这样的话就是未来你可以用就是跟你做 PPT 一样 , 它只不过是替你做了这个 PPT 而不是说我给你生成了一个奥特曼把你的房子给拆别了那种 。
然后多模态的进步好像对你们影响不大对吧 ? 因为你们不用生成 。
多模态的进步就是在这个阶段对我们影响不大 ,但是多模态是一个绕不过去的一个东西 , 然后下一步我们会去融入更多的那个多模态的一个是用来分析一个是用来生成 , 然后我们不是说完全不想做生成而是说我们不想做一种无效的那种迭代 , 就是说人家出了个新模型我们也连一个 API 然后表现的自己很勤奋 ,但是实际上你不增加价值 , 就是我们
得有一个好的一个切入点就是在它的模型 API 之上我们加入到跟剪辑有一个好的一个结合 , 然后这个对于我们来说它才是一个值得做的一个事 。
在你看来未来什么样的一个图景你会觉得 ChatCut 算是达到你想象中的一个成功了 ?
成功定义54:36
我可以绕一点的回答这个问题 , 就比如说 Sora 刚出来的时候那个时候我们刚开始琢磨做这个 ChatCut 这事 , 然后 Sora 出来还不是那个 Sora app 出来是那 Sora 那个 demo 出来 , 当时滑雪那哥们就是一看就是觉得还拍什么电影以后就是说就用这个就完了 , 当时就是世界一下慌了 , 然后它那个东西就是标识性很强 , 就是一看就是哇 Sora 真厉害 , 然后它是一个好的事
也是一个坏的事 , 它限制了就是创作者在其中的参与的这个部分 ,因为就是你做的那个东西怎么着不管你怎么去 prompt 它最后出来的还是一个 Sora 出来的一个东西 , 然后它是一个可辨识的一个东西 , 然后我觉得这个是首先我们要回避的一个东西 , 它不是一个限制别人的一个东西 , 我觉得就是对于我来说成功是一个就是 ChatCut 可能是一个就像你写邮件的时候或者说你日常工作
里面用 ChatGPT 一样 , 它是一个完全跟你的质量已经没什么关系了 ,因为它是一个每个人都可以用的一个东西 , 然后其实达成的是你心中自己就是你用 ChatGPT 做出来的东西一开始的时候你会觉得哦我有了 ChatGPT 什么都能做但是最后还是达到了就是你找到了你的这个水平 。
这很有意思 , 一开始我们可能以为有了 ChatGPT 大家的能力都会统一拉到 1,000 分 。
是的 ,但是我觉得这个就是你有一个这个上知天文下知地理的朋友而且你一直可以操纵他你应该是一个天才 ,但是没看到有特别多的这个天才 。
我们来聊一下团队 , 之前其实在十字路口的开放麦你有一个分享我印象很深 , 就你讲说这个你们团队里面有很多的炼金师这个身份 , 就可不可以再快速的介绍一下炼金师是一个什么样的一个身份 ?
一个炼金师它一定是一个双重身份 , 就是它本来有自己的一个职能 , 比如它是一个工程师它是一个研发它是一个设计师它是一个产品 。
炼金不能当饭吃 , 只能当副业 。
炼金是副业不能当饭吃 , 或者说炼金是一个荣誉 , 比如说当你做一个东西就是做到一定程度的时候哦你是一个炼金师 , 然后给它的定义就是它是一个就是有点像那个古希腊那个词就是 amateur, 就是我们现在把它翻成业余 ,但是实际上什么是一个 amateur 就是他为爱而做的一个人, 就是 amor 与它相反的是专业的人 ,他其实在现在来说专业是好的业余是不好的
,但是在古代那个就是专业的是就是说你为了钱做这事 , 然后一个是为了爱做这事 , 当然钱是一个基础 ,但是我觉得它一个东西的突破往往来自于一个人内心对它的一个执念 ,但是我觉得现在有这个 AI coding 之后可以让你的团队规模不那么的冗余 , 然后让每个人都更大的发挥自己的这个灵光那方面的价值 。
所以在 ChatCut 里面有哪些功能或者有哪些我们今天看到的部分是因为炼金师为爱而做的 ?
就是 MG 动画是一个对我们来说是一个突破 , 然后它不在我们的 PRD 或者说每周的目标里面 , 它是我们的产品同学它对这个东西自己有执念 , 然后它在做其他事的时候它一直就在 vibe 这个东西 ,但是它刚做出来那个两天 Gemini 3 就发布了 ,Gemini 3 一做 what the fuck 就是那咱们别的事先放一下咱们先做这个 , 然后这个就是一个命运给我们的一个机会 , 然后另外
就是可能有的人会把这个说法理解成哦你不尊重工程师 ,其实这个传统的方法也有的 ,但是我的意思是工程师也可以是炼金师 , 甚至说在这个 AI 时代工程师就是你最好也学会炼金 , 你只有这样 AI 不会淘汰掉炼金师 , 你如果严格按照做作业的话就是 AI 会去逐渐自己把作业给做了 。
所以听起来其实你是在想要营造一个团队的氛围是比较去 empower 大家去激发大家 , 让每个人都可以比较自由的为爱去做一些灵光一现的功能出来 , 那在面试的时候怎么去找这种人呢 ?
你会问什么问题呢 ?
就之前可能是更关注这个人的技术背景他有没有能力去把我们需要解决的问题去解决 , 然后我觉得现在的话更关注一个人的综合的这个素质 , 可能就是他特别喜欢吃一个东西他特别对一个东西特别感兴趣 , 就是你如果对任何一件事都没有兴趣的人他可能就是对任何一件事也不会有一个好的一个标准 , 然后你就很难去炼金 。
这会让我想到 Google 曾经也讲说 80/20 的文化 ,是的 ,有 20% 的时间是给大家自由呼吸自由创造的 , 就今天 Notebook LM 都是这样做出来的 。
我觉得可能有很多特别伟大的产品它一定是具备一定程度的这个炼金的这个成分 , 就比如说 Claude Code, 就是 Claude Code 不来自于一个理想 , 它就是那个人说就是哦我自己得给自己做一个东西然后 oh it worked, 就是我觉得人类历史上现在我们在课本里面读到的很多时候是那种一个伟人他为了一个伟大的事做了很多付出得到了他想要的那个结果 ,但是很多时候是这
个他不知道结果是什么样的 ,他是就是一个一个尝试然后最后哦这个红水加绿水是蓝水然后这蓝水一放到伤口上伤口就愈合了 , 我们管它叫炼金但是这个词实际上是一直存在的它叫 Tinker,他在鼓捣这个东西他在研究这个东西他不知道这个东西他的工作就是哎咱们试试这个 nothing 咱们试试这个再试试这个 , 然后我觉得就是下一步我需要学会的或者说我
们需要提高的是如何将这种意外的这种收获把它给系统化的去制造这种意外 。
它有可能系统化吗 ?
我觉得完全有可能 , 这个就是管理的这个难度和它的意思所在 , 如果就是 1 加 1 等于 2 那个没什么意思 , 就是它得是这个系统性的去制造就像那个 anti-fragile 很脆弱的那个理论 , 我特别喜欢那本书 , 就是说你得去制造利于你的这个意外 ,因为那个的杠杆是远远大于就是 1 加 1 等于 2 的 。
所以听起来就是你还是蛮期待一些意外的发生 , 这是不是也是因为背后你暂时还没看到一条非常清晰的路怎么通向 ?
No No No 我觉得是完全相反 , 我觉得正是因为就是我能特别的清晰看见这个东西的结果 , 所以说就是我不用按着团队的脖子说按照大哥的意思走 ,而是说就是这个结果它特别清晰所以说哦你走走这条道也能走走这条道也能走哦你想走这条道 that's okay too,因为我能放心大胆的让大伙去走因为就是我能看见那个东西 , 当你能听见这个音
幸福九分1:01:22
乐的时候你弹什么都是对的 , 然后相反的情况是这个你如果是目标不清晰的时候你做什么都是错的 , 老板不知道自己想要什么所以我做什么他都是不会满意的 。
很有趣 , 如果说这个生活的幸福度的满分是 10 分你觉得你自己现在有几分 ?
我觉得我现在是 9 分 。
哦非常高 , 这是一直都很高吗还是最近那么高 ? 是 ChatCut 带来的吗 ?
我觉得就是我在跟别人提到 ChatCut 的时候 , 就是我能第一次感受到就是我身边有一些财富自由的人投来羡慕的目光
,是因为就是我有事可以做 , 然后这个事它不是一个 arbitrary 一个武断的一个事 , 就是说我做了一下市场调研然后我觉得 there is money in AI video editing。
是因为你在为自己的热爱去做 ?
Yeah 就是我能感觉到上帝的手在推动这事就是我一直说上帝但是是一个无神论者 , 就是 this is my life's work 然后感觉这个能去让你找到你的 life's work 就是能找到这个 VC 能去就是 it became a real project 就是这种事发生的几率不高所以说就是我拍过很多片子然后其实人生就是一部电影就是有的时候你得知道就是这个是电影的哪一幕 this is a good scene 就是电影里面的很
多悲剧是那种一个好事发生的时候他不知道珍惜然后作为观众的时候你看这个男人不懂事这个女的这么爱他他都不知道珍惜最后他有一个悲惨的一个结局 , 就是我在这个电影里面现在这个故事线里面我没有那个问题就是 I know it I know 就是 I'm very lucky。
你知道自己被爱着 。
那失去的一份是什么 ? 就是我觉得当一个人特别的具有这个竞技的这个心理的时候他可能就不会完全的快乐 , 然后我可能会有一天到达那个境界就是说我又能高效的做出所有的工作上的决定但是同时又能保持心态完全的平静 ,但是今天的这个境界还是这个一个受 ego 所一定程度的操纵 , 然后去有一个跟别人 compete 竞争的一个心理 , 然后我觉得可能是一个在
这个阶段需要的一个东西 ,但是这个东西的存在会让你的幸福指数稍微降低一些 。
如果有机会你还会想要做导演吗 ?
导演它是我任何时候都可以做的一件事 , 正是因为这个所以说我不会说特别着急就是说哦我几年没拍片了我得拍一个片 , 就是我现在做的每一件事都是会让我成为一个更好的一个导演的燃料 , 就是我在那个罗德岛设计学院第一天上那个电影课的时候教授问的问题是这个你如果不是一个导演你会去做什么 , 然后有人会说我去当一个木匠我去当一个画家
其实我最关心的是那个就是接我爸的那个厂子 , 然后教授就说就是其实那个就是你的电影 。
你最想过的人生可能就是你最适合拍的电影 。
就是电影它不是一个东西 , 电影它是一个载体 , 它是一个封装器 ,但是很多学电影的人会以为热爱电影本身就足够你能拍一个电影 , 电影它只是你对生活的一个理解 , 我觉得现在做这个 ChatCut 是我现在需要做的事 , 电影你看侯孝贤就是我可以到那个年龄的时候我去做那个事 。
好 ,OK, 谢谢凯文 。
也祝福 ChatCut, 希望可以越做越好 。
谢谢 。
你状态可以一直保持在 9 分 。
谢谢 , 十字路口 。
好 。
拜拜 。






