开场与快问快答0:00
欢迎收听 《 十字路口 》, 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会 。 十字路口是乔布斯对苹果公司的一个比喻 , 形容它站在科技与人文的十字路口 , 伟大的产品往往诞生在这里 。AI 正在给各行各业带来改变 , 我们寻找 、 访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者 , 和他们一起探索和拥抱新变化 、 新的可能性
。
我是 《 十字路口 》 的 Koji, 联合创办了街旁 、 新世相和躺岛 , 发起了 AI Hacker House 这个新一代 AI 创业者的社群空间 。
我相信科技 , 尤其是 AI,是我们这一代人最大的价值创造机遇 。 欢迎大家找我聊天 , 碰撞想法 , 链接下一个可能性 。
我是 《 十字路口 》 的 Ronghui,在美元 VC 工作过 ,也做过 5 年的硅谷驻站记者 , 关注科技发展和商业故事 ,也欢迎大家找我聊天和我交流
。
本周的 《 十字路口 》 呢 , 我们来聊一下 AI Coding。AI Coding 呢 ,是今年可能整个 AI 领域最热的话题之一了 。 最开始是 Cursor, 它年营收做到了 5 亿美金 , 然后估值也这个疯狂的飙升到 100 亿美金 , 然后是今天可能硅谷最炙手可热的独角兽 。
那这个模型公司 Anthropic 也是在今年发了自己的 Claude Code 之后, 然后它的这个收入的增长曲线突然变得非常的陡峭 , 甚至这个超过了 OpenAI, 当然它基数可能小一点 。
对 , 然后从辅助编程的插件到深度整合的 IDE, 再到可以独立完成一个编程任务的智能体 , 就是各种形态的 AI Coding 这个层出不穷 。
然后我觉得 , 大量的资本和顶级的人才都在往这个领域去进入 。 然后黄仁勋曾经也说 , 就人类的语言很可能就是未来的编程语言 , 我们不再需要一个程序语言了 。
那这句预言感觉上在加速成为某种现实 。 那在国内呢 ,AI Coding 同样是非常火热的 , 就差不多两个月前 , 阿里发布了 Qoder, 然后我们身边很多资深的开发者的朋友对 Qoder 的评价都是很高的 , 尤其是这个赵纯响 ,也上过我们的播客 。他有一次告诉我们说 ,他觉得这个炸裂式的好 , 尤其是对于这个存量的代码的可视化的能力 ,也是其他的 AI Coding 产品所
没有提供的 。 那因此本周的 《 十字路口 》 我们非常开心邀请到了阿里巴巴 Qoder 的负责人, 也是丁宇 , 化名叔同 。
来和我们一起聊一聊 , 就是看上去在一片红海的 AI Coding 的这个战场里面 ,Qoder 所诞生的故事和你们的一些思考 。
你好 , 叔同 , 欢迎来到 《 十字路口 》。
很高兴来到 《 十字路口 》。
我们还是从快问快答开始 , 请问叔同你的年龄 ?
42 岁 。
毕业的院校 ?
吉林大学计算机专业 。
给我们一句话安利一下 Qoder。
Qoder 是一个面向未来的产品 , 所以呢 , 它是定位为下一代的智能体编程平台 。
在 Qoder 之前 , 您在做什么呢 ?
我是加入阿里有 16 年了 ,其实做过这个淘宝的架构 , 做过双十一的技术负责人。 然后过去 10 年呢 , 主要围绕在整个容器化呀 、 云原生啊 , 包括像阿里的一些云原生化的技术演进啊 , 还有一些这样的技术的产品化上 。
你的 MBTI 和星座分别是什么 ?
我的 MBTI 是 INTJ, 架构师 , 跟我的工作也非常的相像 。 星座是天蝎座 。
目前 Qoder 的这个用户规模和商业化的进展 , 这个方便讲吗 ?
我们上线两个月吧 , 然后呢 , 现在已经有 50 万的活跃开发者 。 对 , 商业化也是比较符合预期的一个发展 。
AI Coding全景3:40
可不可以请叔同先给我们讲一讲今天这个打得火热的 AI Coding 这个赛道的一个全景图 ? 可不可以给我们科普一下 ?
嗯 , 好的 。 对 ,因为首先其实大家都一个行业共识嘛 , 都有一个共识 , 就是说大语言模型其实非常擅长 Coding。
对 , 然后呢 ,其实也有不同的这个团队开始在这个方向去打造一些产品啊 。 对 , 那其实这个就很自然而然的就会出现说 , 我如何去把这种一句话的需求 , 我有个想法 ,有个 idea, 能够去实现出一个我的软件和服务 , 一个网站 , 对吧 ?
比如说像那个 Labo 呀 , 或者 Build.io 啊等等这一类产品 , 它往往就是服务于我们讲的这些创作者或者叫泛开发者 。
那这种情况下其实可能带来一些问题啊 , 就是说这样的产品 , 它的生命周期可能是比较短暂的 。 对 ,因为每个人都有想法 , 每个人都可以实现 , 可能几块钱就能实现一个自己的软件 ,但这个软件它的生命周期能存活多久 , 对吧 ?
如果它只服务于自己的需求 , 它是没有办法长时间生存的 。 对 , 所以说就自然而然就出现了一些 , 就是能够把自己的作品成为一种平台 , 能够让别人来采购我的作品 , 来使用我的作品 , 就出现了这样的平台 , 对吧 ?
比方说咱们国内也有一个团队做这个 Ubuntu 啊这样产品 。 对 , 所以说这是在这个领域啊 , 那我们把它定位为这是一个从 0 到 1 去做一些通过 AI Coding 去做一些这个软件服务的这样的一些产品形态 。
对 , 那其实还有一些产品 , 比如说像今天讲的 Cursor 呀 , 像 Claude Code 呀 , 就是刚才讲的这种集成式的 、 一站式的这种工具啊 , 那其实它们解决什么问题呢 ?
其实它更多的解决是说 , 今天我们行业中这种专业的开发者就有 3,000 万 。 对 , 那其实大家每天在生产大量的这种代码呀 、 软件服务啊 , 去产生商业价值 。
对 , 那如何去给它们提升效率 ? 因为大语言模型 , 它的编码能力已经超过人类个体 。 对 , 那怎么把它应用到人类个体的工作中, 来产生更大的价值和这个生产力 , 提升这个程序员的产能 , 对吧 ?
那其实从这个角度就会有一些专业的工具出现 。 对 , 然后呢 , 它就是在各个场景 , 比方说在补全的场景 ,在智能体协作开发的场景 , 甚至是我们讲的自主编程的场景 , 对吧 ?
它就提供了各种形态来解决这一个领域的问题啊 。 这个领域往往就是说我们讲的从 1 到 10 或者从 10 到 100,因为每一个软件当它开始产生商业价值的时候 , 它其实就需要这个深度理解啊 、 长期迭代啊 , 它就有一个长生命周期的维护的一个过程 。
对 , 所以说它对于我们这个所谓的 AI Coding 产品或者 AI 产品的这个要求就不一样了 。 对 , 所以说这是这一类的一个产品 。
所以我们可以看到很多这个用户 ,他典型的一个对于 AI Coding 产品的一个用法啊 ,他就是说我先用这个 Labo 去创造一个服务网站 。
对 , 然后当它开始投入商业化以后, 我开始用 Cursor 来进行修改它 。 对 , 所以说这就延续性 ,因为它从 1 到 10, 从 10 到 100, 它的复杂性上升了 。
对 , 一个简单的一句话能生成一个服务的这样的产品就不太适用了 。 对 , 所以它走向专业领域了 。
这是第二类啊 。 那其实整个行业中也有像这个杰文啊这一类 , 就是它的锚定的点就不是说给你专业开发者去提升你的工作效率 , 它的锚定点就是说我直接提供一个数字员工给你 。
对 , 它可以去直接实现一个人力的替代 。 那人力替代它要做的一个核心 , 交付的一个核心价值就是说 , 我能够像一个正式员工一样 , 或者像一个实习生一样 , 对吧 ?
能够接受一个完整的任务 , 能够长时间的去工作 , 然后呢 , 可以协调各种角色和资源 , 最后交付一个完整的结果 。
对 , 这是一个比较超前的一个设计啊 , 这他们刚推出来的时候 。 对 , 那其实今天我们看到像类似于像 Cursor 也好 , 像 Qoder 也好 , 我们这样的产品已经逐步具备了这样的能力 。
所以说这几种形态可以走向一个融合 , 就是服务于专业场景 , 解决复杂任务 。 对 , 解决 , 然后呢 , 可以长时间的工作 。
对 , 所以说 , 基本上我们把它定位为是从 0 到 1 和从 1 到 10, 从 10 到 100, 基本上分这么几个方向 。
但最后你会觉得大家会大一统吗 ?
非常有可能大一统 ,但他们的核心需求都是通过 Coding 提供一种软件服务 , 来满足一个业务场景 , 创造一个商业价值 。
对 , 所以说未来能力上大家做的很强 , 然后形态上做的多元化 。 对 , 所以大家就会走向大一统的一个状态 。
我好奇问一个问题 , 就是有没有模型在这个走向你说的最后可能是一个融合的一个结果里面起到一个什么样的作用呀 ?
因为其实大家也就是很多人会说 , 比如说 Cursor 终有一天会做自己的模型的 。
这个其实影响还是非常大的 。 对 ,因为其实从我们对这个各个产品和这个机模厂商的这个模式来分析啊 ,其实这也是回到说我们为什么说阿里是有机会去做出更强的一个产品 , 更强的 AI Coding 产品 ,是因为我们有模型的能力 。
对 ,其实没有模型能力 , 就是会被有些人说为说定位为说你是一个套壳的产品 。 对 , 成本实在是太高 。
对对对 , 它的成本比较高 , 然后它不能够跟模型进行联动的优化 。 对 , 那其实这个时候呢 , 就是我们会看到对它的估值啊 , 对它这个收入啊 , 对它的估值的影响啊 , 都蛮大的 。
对 ,但是如果有模型 , 它可以控制到它的整个的联合的优化 , 对吧 ? 从它的性能 、 从它的成本 、 从它的效率上面会有优化 。
另外, 对于这个企业的这个利润也会有很大的一个改变 , 对吧 ? 因为它不会成为一个帮模型去创造流量的这么一个服务嘛 。
对 , 所以说我们也判断说他们一定会去提供 , 或者叫构建自己的模型 。
就是你也觉得 Cursor 一定会做自己的模型 。
对 。
我们现在录播客的时候是 10 月中, 然后我们这期播客应该会在程序员的节日 1024 发 。 然后差不多 Qoder 就是两个月前 8 月份的时候才发布的 。
可不可以给我们讲一讲 ,因为我理解你们发布的时候这个赛场已经是一片大红海 。 对 , 你们当时是选择了怎样的一些这个独特的竞争的角度战略 , 来去在一个就是那么激烈的战场里面 , 就迅速的切出一个你们自己的这个赛道出来吗 ?
差异化战略9:20
对 , 这也是蛮好的问题啊 。 因为其实本身我们在推出产品的时候 , 整个行业中的相关性的产品已经非常多了 , 就是这个红海的市场 。
对 ,但是其实我们对这个市场和产品定位有一个自己的独特的一个判断啊 。 对 ,因为其实还是从刚才的这个逻辑来分析 ,Web Coding 其实被大家广泛接受 , 大家会觉得特别惊艳 , 一句话就可以创造一个软件服务 。
对 , 很惊艳 。 但是呢 , 我们会发现说 95% 以上的专业开发者 ,他都在维护那些真实软件 。 对 , 什么叫真实软件呢 ?
我们认为就是说真正在产生商业价值的软件 。 一旦它产生商业价值 , 它就要为它的用户负责 , 为它的客户负责 。
那它就要变成一个非常严肃的一个修改迭代 , 然后呢 , 演进 。 对 , 它就不能有任何的故障问题 , 对吧 ?
它这个时候呢 ,而且它会有很多的历史积淀 , 可能它存在了 5 年、10 年, 当这个 AI Coding 的工具对它的历史也很了解 。
对 , 就是不能乱改 。 对 ,不能这个发挥想象 , 或者是说产生幻觉 。 对 , 就是所以说我们看到说今天这是一个价值高地 ,因为它是真真正正在支撑这个信息产业 ,在产生价值的一些软件服务 。
那今天很多的工具的切入点啊 , 都是从 Web Coding 开始做的 。 那我们呢 , 就所谓的另辟蹊径 , 我们是从面向真实软件开始定位和构建我们的产品 。
对 , 所以说这是我们的第一个切入点 , 就是与众不同的 。 所以我们这也是另外一个点呢 , 就是说我们还是看到了一些趋势啊 , 就是说随着 AI Coding 的发展 , 最开始呢 , 大家其实是以人为主导在写代码 。
所以说就是您刚才也讲了 , 就是它是一个辅助编程的一个阶段 。 对 , 就是说人在写 , 然后 AI 帮忙填一些空 。
对 , 这是它一个比较常见的一个状态 。 对 , 像这个业界用的比较多的 type type 啊这些 。 对 , 然后呢 , 到第二个阶段就变成了一种协作式的 , 协作式的编程 。
协作式编程就是说两个人可以同步互动 , 就人和 Agent 可以同步互动 , 然后把一些 , 比方说这里有些代码 , 帮我补一些文档啊 , 补一些注释啊 , 或者补全一些功能啊 。
另外就是说帮我把这个 , 反正就是他俩可以这个互动 , 把一些任务完成 , 把这个测试全给补全 , 对吧 ?
它是有这么一个合作关系 。 但我们看到随着这个模型跟智能体的这个发展和演进啊 , 就会出现一个 , 就是未来会出现一个新的合作模式 , 我们叫 AI 自主编程 。
对 , 就是说相当于 AI 加 Agent, 它可以形成一个数字员工 。 对 , 然后呢 , 它可以完整的完成这种完整的大块的 , 然后一步跨的去完成一个任务 。
这相当于说我们的这个开发者 ,他有了一个助手 ,他有了一个团队的同学 , 对吧 ? 有了一个 AI 的这个军团 , 能够整块整块的去完成任务 。
对 , 我们看到说这个趋势已经到来了 。 对 , 所以我们的产品把它定位为两个核心的 , 对吧 ?
一个是面向真实软件 , 一个就是说智能体编程平台 。 智能体编程平台就是说我不干 , 智能体干 。
对 , 所以说这是我们对于未来这种开发协作模式的一个定义 。 所以我们从这两个点切入 , 它就会跟我们现有的这些产品会有一个非常不同的一个呈现 。
这个洞察也就是从用户 、 从商业 、 从市场中来的这种从下至上的这么一个需求发现 。 但为什么一开始没有那么多人去做维护软件这个事情呢 ?
是因为它不够酷炫 , 还是因为比较困难呢 ?
我认为两个原因可能都有啊 。 对 ,因为其实每一个人都喜欢做创造性的工作 。 是的 , 就是说我一句话可以生成一个我自己非常喜欢的 、 非常漂亮的网站 , 对吧 ?
这个就让人非常的兴奋 ,有这种获得感 , 对吧 ? 那其实对这个产品也会带来很好的好感嘛 。 那其实这个领域中, 要把大语言模型的能力发挥出来 ,其实有各种形态会出现嘛 。
但正因为我们是一个后来者 , 我们其实看到第一次的果实 ,其实有很多人在摘 。 我们希望去直接进攻价值高地 , 所以我们就直接去打整个的这个真实软件的这个场景 。
这里面有一些区别啊 , 就是我们刚才讲 , 从这个我们讲这个开发者的工作的一个阶段 , 就是从这个辅助到协同到这个自主 , 对吧 ?
它有不同的阶段 。 对 , 所以我们呢 ,不是说我们定位为下一代的自主编程的平台 , 我们就不做别的 , 我们其实每一个阶段都做 。
因为我们一个核心的定位是要服务于最广谱的开发者 , 就是不管他处在什么阶段 。 因为其实我们今天可以看到 , 中国的开发者跟海外的开发者 ,他所处的阶段就不一样 。
对 , 包括中国的模型跟海外的模型 ,他所处阶段也不一样 。 就是因为我们有这个不同的产品啊 , 跟客户有非常多的这个互动 ,因为产品本身也跟客户建立很紧密的连接嘛 。
我们其实都能看到 , 就是大家这个使用习惯上的差别 , 包括像就是说今天有多少人是以国内这个市场为例啊 ,他就是以补全居多 , 问答居多 , 就是说还是说我有不明白的 , 然后呢 , 我让模型给我回答 , 回答完以后我来改 。
那海外其实已经进入到 , 就是我们讲就是说君子啊 ,他已经进化到说自己已经不怎么干了 , 都让模型帮我全改掉 。
所以大家处的阶段还不一样 。
所以会有这种相对更针对中国的情况的一点差异化 。
对对对 。
Qoder 我理解是一个 day one 就做全球市场的产品 , 对吧 ?
是的是的 。
并没有特别强调这个中国版和海外版 , 就是一个版本 。
对 , 所以说我们就看到什么呢 ? 我们必须服务于广谱开发者 , 所以说这几类功能都要有 , 然后用户可以在自己的使用习惯上去组合 , 组合这个产品的能力 。
比方说哪个功能 , 比方说补全用的多 ,他就多用补全 ;Ask 用的多 ,他就用 Ask。 对 , 那如果说今天我们中国开发者快速的去拥抱最先进的生产力 , 那我就可以直接用到我的自主编程 。
对 ,因为我这些能力都有 。 所以说这是从一个维度啊 , 就是说我们要第一是服务要服务于广谱的开发者 。
另一方面 , 就是我们的形态会比较多元化 , 就是说首先我们有 IDE, 我们也发布了这个命令行 , 我们也会发布这个结对的插件 。
对 , 然后我们也会在不同的场景上去集成使用 , 就是说比方说今天有一些这个工作的流水线呢 , 各种内部的这个平台啊 , 它都可以用这个编程智能体去进行委派任务啊 , 进度跟进啊 , 然后去校验一些结果呀 , 它都可以做 。
所以说从不同的切面 , 不同的形态 , 然后从这个输入的这个输出的方式上, 比方说图片的输入啊 , 语音的输入啊 , 从这个多模态的支持啊 , 对吧 ?
我们其实就是希望说能够在这样一个产品平台上 ,以这种不同的模态 、 不同的形态 , 然后呢 , 它形成不同的触点 , 来满足我们对于 Coding 和制造软件这种多元化的需求 。
这是我们希望去呈现的一个产品 。
用户会最常把你们拿去和谁比较呀 ?
现在还是 Cursor 比较多 ,但 Cursor 比较大啊 , 我们还是在追赶的一个过程 。
所以你们提供的和 Cursor 最大的差异化 , 第一就是这个存量代码的可视化 , 让大家更好的去维护已经写好的软件 。
然后第二就是刚才说到这个智能体 , 就它可以更独立的去做这个编程 。
我们为此也做了很多的这个工作啊 , 包括讲我们这个比较倡导这种 Spec 驱动 。 对 ,其实 Spec 驱动也是为了让 。
需求文档驱动 。
对 ,也是为了让智能体能够长时间的 、 独立的完成一个整块的任务 。
这可以具体讲一讲吗 ? 就当你说到这个 , 就需求文档驱动的时候 , 这个是一个怎样的一个工作流 , 它对应着怎样的产品功能 ?
需求文档驱动16:56
对 ,因为这个其实它是一个逐步进化的一个过程 。 因为我们以前讲这个提示词工程 , 后来讲这个上下文工程 。
对 , 所以说本身就是如何去构建一个更好的上下文 , 然后能够让大语言模型在比较可控的情况下, 能够做出更大的这个贡献和结果嘛 , 更长时间的工作嘛 , 对吧 ?
其实是这么一个演进的一个过程 。 然后呢 , 对我们来说 , 为什么说一定要去用 Spec 驱动的方式去做这个驱动 Agent 的工作嘛 ?
其实是因为我们要想让它做更大块的任务 ,其实必须要把这个需求说的很清楚 。 这个需求 , 包括这个我们讲人类其实要提供的内容 , 需求的洞察 、 业务逻辑的设计 、 技术模式 、 技术架构的选择 , 还有就是说我的设计的一些规约 , 然后呢 , 我怎么设计模块 , 你的实现的要求是什么 。
然后呢 ,其实相当于实现定义出一个技术文档 、 技术文档 , 还有业务架构的设计 , 把这些文档设计出来以后, 然后呢 , 当然这个也是跟模型交互的一个过程 , 就是它模型就能理解说啊 , 这个给了我这么大一个任务 , 这个任务具体有哪些需求 ,有多少步骤 , 要把这些东西写清楚 。其实它其实是原来的人与人之间的协同方式的一个拓扑啊 , 对吧 ?
因为原来其实我比如说我们三个人要开发一个软件 ,其实也是一样的 , 比方说你是老板 , 你要提了一个需求 , 然后呢 ,其实我们就在各种调研 , 然后搞清楚到底要的是什么 , 技术怎么选择 , 然后呢 , 这个需求写的很清楚 ,PRD 写的很详细 , 然后呢 , 我们怎么验收 , 对吧 ?
然后怎么去上下游对接 , 数据怎么对接 , 业务怎么对接 , 把这个写清楚以后, 程序员来实现 , 实现完以后我们再推向市场 , 然后看反应 , 看迭代 。其实这个就是我们把这个东西拓扑当 , 就是把这拓扑到了整个的这个跟这个大语言模型交互的一个过程 。
所以说它就能够接受到一个详细的 Spec, 它就可以异步化的 、 长时间的 、 自主的去完成这个需求 。 同时它可以去自主的去验收 , 来校验说这个结果是不是符合这个开发者的一个预期 。
所以说 Spec 驱动是一个想让它长期工作 、 长时间工作的一个必然的一个选择 。
还是跟就是传统正常人与人之间 、 团队之间开发交流的一个真实流程的一个映射 。
但这里其实也有些小 tips, 就是说这个需求文档现在其实人也不愿意写 。 所以呢 ,但是就是说大语言模型不但擅长写代码 , 它也很擅长写需求文档 。
其实我有注意到用 Qoder 的过程中, 我给它一个想法之后, 它第一步是帮我写文档 。
就是我们为了这个写好 Spec 文档 ,也构建了一些智能体 。 对 ,但这个没有显性透出 。在我们的功能模块里 , 就是先把一句话需求 , 就每个人都是老板 , 先写一句话需求 , 然后呢 , 我们这个写 Spec 的智能体就会帮它拆解成一个非常标准的 、 常见的一些设计文档 , 然后人在里面再做一些微调 , 或者再进一步提要求 。
然后最后这个文档人确认一遍 , 确认一遍就是觉得内容非常的认可 , 它就可以开始执行 。 对 , 所以说这样就可以驱动智能体长时间的去执行 。
我们之前试用了 Logic,他们上了一个新产品 , 那个新产品它有一个类似的一个理念 , 然后就会把需求文档 、 整个这个 VI, 再加上它的那个情绪板 , 就作为一个常驻在无线画布上的角落的一些资源 。
然后所以之后再去做任何的页面和任何的改进的时候 , 它都会记忆去 , 就是取常驻在那的这个 , 像我做这个网站的宪法一样 , 我不管干啥我都去读读宪法 。
对 , 这个也是一个比较常用的一种约束它行为的一种方式 。 因为其实在我们这里也是一样的啊 , 比方说我们今天有一些系统提示词啊 , 对吧 ?
有一些记忆啊 , 就是说因为我们其实为了提升产品的这个 , 能够更满足人的这个习惯和需要 , 所以我们做了很多的这个趁手的工具给到我们开发者 ,也是一样的 。
就是说有哪些规则 , 就什么事不能干 , 什么事应该怎么干 , 把这些东西像您说的宪法 , 把它写到我们的 rules 里 。
对 , 然后它在执行的过程中, 它就不会跳出这个框架 , 就好像每个公司先约法三章 , 我们把这些东西也提供了这样的一些开放性的接口给到我们的用户 。
那除了就是这种传统的一般流程的一些映射参考 ,有没有什么新的调整啊 、 变通啊什么的 ?
其实在我们看来还是形成了一些这个基于
AI 时代一种新的一种开发的这个方式 。 因为以前我们去构建一个工具啊 , 往往我们最看重的一点就是不要打断用户的心流 , 就是说一定要让用户不受任何干扰的整段整段时间的工作 。
产品哲学21:44
对 , 比方说以前这个 JetBrains 或者是 VS Code 呀 , 它的一个核心理念就是不打断用户的心流 , 就是你所有的工作在我这一站式的平台中都能够去心无旁骛的去持续性的工作下去 。
所以说这是一个理念 ,但实际上到了这个 AI 时代啊 , 这个心流其实蛮难维持的 。 对 ,因为它的工具比较多 , 然后呢 , 相当于你开始结对编程了 , 我们就讲这个大家在协同的过程中开始结对编程 , 结对编程就必然有疑问 、 疑答 、 有互动 , 然后呢 , 就会有一定的拉扯 , 就是说你这个做的我不太满意 , 那你帮我改一下, 或者我再提个新的要
求 。 对 ,因为它这个活变成两个人在做 , 或者是一个人带一个小队在做 , 所以说它这个东西就会发生变化 。
然后呢 ,在这过程中还要约束这些智能体的行为 , 就刚才讲的 rules 的这种约束 。 然后这里面其实我们还提供了一个智能体呢 ,也为了表现的更好 , 它开始不断的去归纳这个开发者他的这个行为习惯 ,他想要什么 、 不想要什么 , 哪些东西他会接受 , 哪些东西他会拒绝 , 那他会归纳 , 归纳完以后他觉得他获得了一个新知 , 然后他把它写到记忆里
去了 。 但是对这个用户来讲 ,他就觉得你这个知识或者你这个记忆也不完全是我想要的 , 我只是今天是有这么一个情况 。
所以说他还会去编辑和修改他的记忆 。 所以说这种方式就会发生变化 , 包括我们讲为了节省成本 , 对 , 那用户希望节省成本 , 然后呢 ,他就可以去比方说压缩这个上下文呢 , 对吧 ?
或者切换模型啊 , 或者重启会话呀 , 就他时刻想着这些事 。 所以说他心流已经变掉了 。 所以我们从产品的这个构建过程中, 就是在这里面要取得一个平衡 , 又要给他趁手的工具 , 又要能够让他有非常高的生产力 , 又不能给他一种老是被打断的感觉 。
这个不太容易 , 尤其是心流被打断 ,因为听起来被打断的原因是很难去对抗的 。
所以是这时候就要给他一个掌控感 , 就是如果说我们这个我们的用户 、 我们的开发者 ,他在掌控这个一整个局面和像您说的这样 ,他在约束整个的行为和走向 。
所以说他的这个感官是变了 ,但是实际上他的感受还是好的 。 对 , 这也是说为了适应 AI 时代 , 人的工作方式要发生一定的变化 。
对 , 这也是一个关键点 。
这里可以有一个比较具体的例子吗 ? 就是你们为了帮用户进到心流状态 , 比如说做了哪些特别的功能啊 , 或者做了哪些特殊的取舍呀 ?
其实我们每一个功能啊 ,其实我们都会考虑 , 就都会考虑说这里是不是会让用户觉得被打断 , 然后呢 ,是不是会让用户觉得要有理解成本 , 够不够自然 。
对 ,其实我们今天觉得说被打断或者叫违反了他的心流体验 ,也不是很重要啊 , 就是因为新的模式必然是这样的 。
但是呢 ,有一点很重要 , 就是不要让他有理解成本 。 如果一个东西一眼扫过去 ,他看不懂 。 对 , 就是你的传达和你的行为和你的设计 、 交互设计 , 就是让人有这个理解成本 、 思考的成本 , 这个就有问题 。
所以我们对于开发者一定要特别自然 。 对 , 所以我们有一些这个功能都是围绕着这些原则在做的 。
我记得我刚做产品经理那会儿啊 , 就是 15 年前吧 , 那会儿有一本很畅销的书 , 叫做 《 别让我思考 》, 就 《Don't Make Me Think》。
它在讲的这个用户理念的一个准则 , 就用一本书就讲这么一句话 , 就是不要让用户来思考 。
所以今天我们做的一些功能也是一样的 , 包括可能您也知道我们整个就是没有提供模型的一个选择 ,其实没有提供模型选择也是我们贯彻这个理念的一部分的实现 。
这个确实很有趣 ,因为大家都会默认你们就会用这个千问的模型嘛 。 事实上好像我看你们官方网站上说 , 我们这个谁说他我们就用谁 ,而且不让用户选 。其实我们这个产品呢 ,其实在这方面呢 ,也是有一个最高原则吧 , 就是说整合全球最优的模型 , 然后呢 , 给用户最好的效果 。
对 , 所以说这里面会有海外的模型 ,也会有 Quill 的模型 ,但是在什么场景去使用什么模型 , 我们认为这也是说不打断用户心流的一个体现啊 。
就是说为什么呢 ? 因为其实如果像 Cursor 一样 , 我们比方说有 40 个模型放在那里 ,其实对用户的那个打断是很强的 。
就是说它要形成一个知识 , 就是说什么模型有多贵 , 然后呢 , 擅长干什么 , 我在什么场景用谁 。
对 , 然后我还不断要测一下, 给他们做个排序 , 可能这个过了下个月以后他们又发版了之后 ,他们能力又变了 , 对吧 ?
所以我还得再测一下, 再他们在我心里做个排序 , 然后我再合适场景去换 。 这个打断是很要命的 , 对吧 ?
就是大家变成了一个这个模型的选择器和这个训练师了 , 对吧 ? 或者叫测试员了 。 会不会这其实也是这个希望 , 就有些用户他希望自己有掌控感 , 尤其是当市场上出现 , 比如说我们随便说 Claude 发了个 5.0, 对吧 ?
大家都说它这个石破天惊 , 就是 10 倍的这个效率提升 , 所有人都想用 。 但如果在 Qoder 里面它没法直接选 5.0 的话 , 那它会很难受 , 它可能会流失 。
你怎么看呢 ?
对啊 , 这个我们就是用结果来给客户一个答案 , 就是说你在我的这个 Qoder 这个产品里面问同样的问题 , 会不会跟那些显性能看到 Claude 5.0 的产品有差异 ?
就是我们用结果来说话 ,其实这里面跟模型 、 跟 AI Coding 类的产品其实最重要的三个点啊 , 就是不可能三角啊 , 就是你的性能 、 你的效率 、 你的成本 。
对 , 你要想又快 , 对吧 ? 又便宜 , 那你可能就很慢 。 你要想又快 、 效率又高 , 或者叫性能又好 , 那你可能就成本比较高 。
对 , 所以我们一直在权衡这件事情 。 所以您这个问题我们看法就是说 , 最好的模型出现别人可以选 , 我们没有选 ,但是我们的结果一定是不比对方差的 。
对 , 甚至要比对方要好 。
这个不可能三角会有一天可以变成可能吗 ?
这里面核心的技术挑战就是上下文工程 , 就是说今天谁能够以一种更加优秀的方式去构建上下文 ,因为这个所有的成本消耗 、 性能和效率都是在上下文工程里去解决的 。
对 , 另外就是我们讲的模型选择器 , 模型选择器对我们来讲 , 我们有一个理念 , 就是说机选要优于人选 , 这是我们第一个理念 。
第二个理念就是说平台知识要优于个人的知识 。 对 ,因为我们其实有海量的用户和海量的使用 , 我们其实更容易去知道 ,在宏观上更容易去知道 ,在统计学更容易知道什么样的场景适合于什么样的模型 。
然后呢 , 为什么叫机选优于人选呢 ? 就是说比方说人来选这个事 , 一个是打断了心流 , 另一个就是说我不断的在跟他对话 , 我不可能每一次对话我就切一个模型 。
一般来讲就是我兴起一个会话 , 我选一个模型 , 然后我每问一个问题我是不会换模型的 。 对 ,因为对人来讲不可能这么工作嘛 。
对 , 每问一个问题换一下, 每个问题换一下, 那个人就变成一个这个机器了 , 对吧 ? 所以我们给他选择就能够做到每一个问题都给他一个最适合的模型 。
对 , 所以说会给他更好的效果啊 。 对 , 所以说这是我们从理念上跟友商的产品不太一样的地方 。
我们是效果说话 。
那你们会用什么样子的方式能够让一个用户他在不了解你们的情况下, 就是知道是这样子的效果 ?
所以说我们也下一步会开放这个评测集 。 对 , 就是真实的软件的评测集 , 就是让我们整个的这个用户可以在一个公共的数据集里去在不同的产品上比较大家的效果 , 包括大家的耐用度啊 , 大家的成本消耗啊 , 大家的这个完成任务的一个时效性啊 , 还有最后的成果的满意度啊 。
所以说理念归理念 , 产品上要呈现出这样的效果来 , 还是要靠评测 。 当然用户体感也是一种评测 ,但是这个评测集呢 , 就更加客观和这个数据化 。
这个产品对阿里意味着什么呀 ?
其实之前这个我们的 CEO 吴妈其实也讲啊 , 就是说其实 Coding 或者叫大语言模型的 Coding 能力是走向整个这个 AGI 的一个必然的一个路径啊 。
对 , 所以呢 , 对我们来说呢 ,其实它还是要去通过 Coding 这样的产品啊去提升 , 就是端到端的去提升大语言模型 Coding 的能力 。
然后呢 , 它要服务于更多的开发者和服务于更多的场景 。 对 , 所以说它对于我们整个的这个 AI 战略啊 , 它也是其中的一部分 。
对 ,但是具体能够做到多大的贡献啊 ,其实还是看我们产品能够做到多大的市场的这个占有率 。
现在已经非常好了 , 开了一个很好的头 。
对 。
那你来负责这个产品的时候 , 当时比如说有内部 Promise 我要把它做成一个什么样子 ?
我们有一个愿景啊 , 我们愿景就是做世界前三 。
世界前三 ?
对 。
现在第几 ?
现在还远远没有到排名的时候 。 对 ,因为就相当于一场马拉松 ,其实大家其实刚刚跑了 1,000 米嘛 。 对 , 所以还要看大家的后劲啊 , 资源的情况 , 还有就是整个的加速度啊 , 都要去看 。
因为一般听到前三 , 第一反应就是第三 。
其实差别不大 。 对 , 前三跟第三差别不大 。 对 ,但我们认为这是个愿景 ,因为这个市场竞争太激烈了 。
对 ,但其实我们有信心的地方在于哪呢 ? 还是说我们还是有自己独特的优势 。 对 , 即使说今天我们是这个刚发布两个月 ,其实开发者也非常认可 。
对 , 我们这个初步的定的一个产品的定位 , 就是讲做这个价值高地 、 做真实软件 ,也是得到了这个用户的一个非常积极的一个认可 。
对 , 另外一点还是说我们自己对于整个这个包括阿里巴巴呀 , 包括模型啊 , 这些技术人才 , 包括这些这个对这个技术的把控力 , 然后跟这些相关的这个兄弟团队能够互相端到端的去优化 。
对 , 然后提升我们对这块这个整体性能 , 刚才讲的这个性能啊 , 然后效能啊 , 还有这个成本啊 , 就提升产品的综合竞争力 。
对 , 然后从我们其实更多的是要去从这个产品的呈现形态上 、 用户的工作界面上去做大量的创新 。
对 , 然后把底下的模型能力 , 然后把中间的这个上下文组装构建的能力 、 工具使用的能力 , 把它整合成一些更有竞争力的多元化的产品形态 。
对 , 所以说在这个角度上, 我们是整合了很多的这个优势 。 对 , 所以说我们还是认为跟友商的这个比较 , 包括那个这个国际上一些非常先进的产品的比较 , 我们还是认为我们还是有非常大的后劲和比较大的优势的 。
对 , 这也是我们信心的一个来源 。
所以你们立项到上线大概是一个什么样的时间 , 这个周期啊 ?
就是在 2025 年发生的 。
非常快 。
对 。
8 月发布 。
组织与方法32:26
讨论 ,因为我知道之前其实这个阿里已经有很成功的一个编码产品叫通义灵码 , 对吧 ? 那在有通义灵码的这张牌的基础上, 为什么还要再做一个 Qoder?
对 , 确实灵码我们在国内已经做了两年多啊 ,其实得到了这个开发者非常大的喜欢啊 。 然后呢 ,也是在这个插件这个市场 ,在中国是第一的一个占有率啊 。
对 , 所以我们更多的讨论还是在去做一些这个基本面的一些这个抉择啊 , 包括呢 , 就是说我们是以什么平台去做这个全球化 。
对 , 然后呢 ,是以什么形态 ,是以插件还是 ID 还是命令行还是其他的形态 。 对 , 还是智能体单独的这个输出 。
对 , 另外就是说 , 包括我们这个模型选择 , 我们到底是用这个纯自家的模型啊 , 还是说整合全球各种各样的模型 , 对吧 ?
其实我们对这些问题都做了一些深入的探讨 。 对 , 然后呢 , 那最后其实促成我们去做决定的呢 , 我们还是一些观点和判断啊 , 就是说还是从市场出发 。
对 , 就是今天开发者会选择什么样的产品 。 对 , 那我们认为还是说他一定会选择最好的产品 、 最优质的产品 、 最懂他的使用习惯的产品和能给他带来最大价值的产品 。
对 , 那我们还是从这个角度出发 , 还是决定做一个今天 Qoder 这样的一个形态的一个设计 。 对 , 所以说灵码就是我们把它定位为就是服务于中国市场这么一个形态 。
对 , 然后呢 , 当然这样也是为了给我们自己的 , 我们自己的模型也是争取时间 , 对吧 ? 那如果说比方说一年内阿里的模型变成全球最好的模型 , 那其实 Qoder 肯定里面都是 Quill 模型 。
对 ,其实也是在争取时间 ,但是还是要去服务更广大的开发者 。 对 , 我们不能等模型成为世界第一 , 我再去服务开发者 , 这个已经没有机会了 。
对 , 所以我们还是先服务开发者 , 然后给自己的模型也是争取一些时间 。 那我们定下来这样的一个路径以后呢 ,其实大家还是干劲非常足的 。
对 ,因为我们这个是对这个市场足够的了解 。 对 , 然后呢 ,其实我们也打造了一些比较成功的产品 ,有这样的经验 。
所以你们是一个完整的团队 , 这个团队其实不是从零开始来去组建的 。
对 。
这个团队之前就在做灵码还是 ?
对 , 就是当然也有一些做其他的工作的一些同学 , 一起加入进来一起来做 。 对 , 所以我们这个起步也比较快 , 当然大家也都比较拼 ,因为其实对于这样的一些产品和机会啊 ,因为我们都比较信奉这个技术改变世界 。
对 ,但是我们真正遇到一个有改变世界技术 , 或者是把这个技术辐射到全球去改变这个很多的这个开发者 , 然后创造很多价值的这个机会的时候 , 大家还都是非常的拼 。
所以我比较好奇的问题是 , 比如说这个项目在立项的时候 , 你是自己主动要求来的 , 还是就是组织安排的 ?
双向奔赴吧 。 对 ,因为确实灵码也是一个蛮不错的一个成果 , 那其实把它延伸为一个面向全球化的产品 , 我们认为还是非我们莫属吧 。
这我其实刚也突然想到哈 , 它看起来就是从品牌上就是希望能够不要有这些所谓的冠名啊 , 前面是什么后面是什么 , 然后就是一个相对感觉上哈 , 我从这个品牌给我的感觉上相对轻的感觉 , 大家想到我先想到一个工具 ,而不是先想到阿里巴巴 。
这也是我们为什么名字叫 Qoder, 对吧 ?Qoder 这个名字其实它就是那个 C-O-D-E-R 的一个谐音嘛 。 对 ,其实就是程序员 。
所以我们这个定位就是说它也不是说因为哪个模型诞生的 ,因为哪一个平台诞生的 。 对 , 它就是一个程序员 , 它就是你兜里的程序员 , 你家里的程序员和你的团队 。
对 , 所以我们就定位它 , 它没有任何的这方面的一些限制 。 对 , 然后它这样的话 , 它才比较有这个发展空间嘛 。
那你方便介绍一下它大概在阿里这个 AI 的战略里面是一个什么样子的位置 ?
对 ,因为其实很重要的一点啊 , 就是说对于资源的支持啊 , 包括目标的这种解绑呀 , 然后团队的效率啊 ,其实给的比较多的支持 。
对 ,因为其实还是要卸掉一些包袱 , 然后面向这个市场 , 就是说我们要看友商怎么做的 , 别人怎么做的 , 别人为什么跑得快 ,其实我们要跑得快 。其实从这些方面给了我们非常大的支持 。
对 , 我认为这个是最重要的 ,因为很多人都会担心说是不是一个大厂啊 , 它的这个流程啊 , 它的机制 , 它的约束条件会非常的这个复杂 。
对 , 那这个一定会拖慢效率 。 对 , 那尤其对于一些从 0 到 1 的产品 。 对 , 那我们也是认为说其实今天它是一个内部的创新 ,也是一个内部的创业 , 所以给了非常多的这个开放度 。
我认为这是最好的一个支持 。
其实在 Qoder 发布的时候啊 , 大家就说这个 BAT 三家就是 AI Coding 全部都发了自己的产品 。 然后我们再看海外 ,其实 Anthropic 也在就是做 Cloud Code 的吧 ,OpenAI 也有它的这个产品 。
所以想听听从你的视角来看 ,不管是国内还是海外吧 , 你觉得这个创业公司有机会吗 ? 如果有的话 , 机会在哪里呢 ?
从今天来看啊 , 就是创业公司的机会会越来越少 。 对 ,因为今天即使做咱们讲就是 AI Coding 是一个大语言模型的这个封装型的产品 。
对 , 它其实也是需要比较大的这个资本投入 。 对 ,因为其实它要形成一定的规模 , 它的这个团队的投入啊 , 还有就是说它的成本的投入啊 ,其实都是蛮大的 。
对 , 这是一方面啊 。 另一方面呢 , 就是说就是创业公司不占优势 。 另一方面呢 , 就是说对于平台它的优势会越来越大 , 它有一个它自己的费用效应 。
我们就以 Claude Code 为例啊 ,Claude Code 跟 GPT-5 的 CodeX 其实它有它先天的优势 。 对 ,因为它本身啊 , 它拿自己的模型 , 它的成本是比较低的 。
对 , 比方说 Cursor 拿它的成本可能要高几倍 。 对 , 那所以说它就会做出一个就是我们刚才讲的性能又好 , 成本又低 , 效能也不差 。
它就可能就完成这个了 ,因为对它来讲 , 它的平台它保有的这个资源和集群 , 对它来讲是个成本成本 。
对 ,但是它卖给 Cursor 它一分钱都不会少 。 对 , 所以说它就会做出它的优势来 。 这个时候其实但是早期的创业公司有很大机会 , 像 Cursor 也好啊 ,Ronghui 也好啊 ,因为它已经早期它是定义了一个品类 。
对 , 它定义了一个形态 , 然后它就会有一次的先发优势 , 然后再加上今天它的这个迭代的速度 , 对吧 ?
所以说它可以让大家追不上 。 所以说它形成一定的优势 。 那今天这个时点如果再有一些创业公司进来 , 那它可能一定要去创造新的模式 , 对吧 ?
如果说在同类的同类形象 , 跟大厂啊 , 跟一些那个寂寞厂商啊 , 还有跟一些先发优势的厂商啊 , 相比来讲就没有什么优势了 。
国内你觉得从产品上讲 , 你觉得谁做的比较好 ?
我觉得我们做的很好 。
除了你们 , 除了你们 。
其实也没有几家了 。 对 ,其实我觉得都是蛮值得尊敬的对手 。 对 ,但其实我们觉得今天啊 , 这个领域正因为大家有不同的理念 , 然后构建了不同的产品形态 , 它会满足不同开发者的一个诉求 。
对 , 所以说本质来讲 ,在我们看来它不是一个直接竞争 , 它是在一个非常大的领域中去撬动一部分用户 。
对 ,因为今天这个我们就以一个专业开发者的角度啊 , 全球可能最多才覆盖到 1/3。 对 ,其实还有 2/3 的都没有覆盖 。
所以它今天还不是一个竞争很激烈的一个 , 对吧 ? 大家都同质化了 , 各方面都在这个卷极致的这个性价比 , 还没到这个阶段 。
大家在形态上其实也是蛮百花齐放的 。
所以你觉得 AI Coding 产品的用户留存会是你们的一个担心的点吗 ? 因为感觉好像代码库在那的吧 , 今天我可以用 Qoder, 明天我其实也是比较容易再切到 Cursor 的 。
如果比如说 Cursor 那边接了一个 SOTA 的模型 。
Repo Wiki40:13
其实我们一直讲一个逻辑啊 ,因为我们内部其实也有些讨论啊 , 就是我们做这个 Repo Wiki, 就是你讲的这个代码可视化 ,其实我们一直讨论这个逻辑 , 说这个可视化的材料是不是只有在 Qoder 中才能看 。
对 , 那最后我们还是决定说这是不可能的 , 一定是在哪里都能看 。 然后呢 , 一定是这个东西是归属于用户的 , 一定是说它可以导出去 , 这资产是归他的 。
对 , 那但是呢 , 我们就是最朴素的一个想法是说能不能让用户 , 如何能让用户留在这个平台 。 对 ,但是我们还是认为说差异化的能力和开放性 , 对 , 会赢得用户的好感和认可 。
对 , 所以我们第一我们要做出差异化的能力 , 第二我们要做出开放性 。 对 , 我们认为这是最大的粘性 。
我们说到 Repo Wiki 的时候 ,也就是很多这个好评的来源 , 就是也是书同一开始讲的 , 你们针对的是存量代码 , 就是我在痛苦的维护一个可能前面有 100 个人写过的代码 , 对吧 ?
我今天突然接手了 , 我怎么去理解他们 , 怎么在去改的时候保证不要改一个 bug, 改出 100 个我都不知道哪里又冒出来的 bug。
这个是你们提供了一个很大的价值 。 这个 Repo Wiki 这个事它听起来很容易 ,但是我想象中做起来可能没有那么容易 。
一个是存量代码有可能这个又多又乱又杂 , 就你们在这个过程中是怎么做到 , 就是比较好的把它整理出来 , 然后还原出来 , 让用户可以清晰的去理解这个存量代码的 , 这里有没有一些可以分享的地方 ?
其实您讲的这个它可能又乱又杂等等啊 , 或者是比较复杂 , 工作量比较大 ,其实这些工作对于大语言模型来讲都是比较擅长的 。
对 , 我觉得这是第一个点啊 。 所以我们这个实现都是用大语言模型来实现 。 对 ,但是我们会构建出自己的一些这个相关的智能体啊 。
对 ,但实际上我们的一个判断 , 包括对于整个开发者日常工作的一个理解来讲啊 , 就是说所有的这个工作的这个沉淀 , 最实时最这个新鲜的就是代码 。
对 ,因为今天比方说老板提一句话需求 , 我们把这个功能改掉 。 对 ,但是大家不会把文档再补一下 。
对 ,因为这个东西非常不经济嘛 。 对 , 所以说代码一定会改 , 代码呈现出来的业务形态一定是老板需要的 , 一定是产品经理需要的 。
对 , 所以说随着这样的演进啊 , 最后那个文档就已经很失真了 , 对吧 ? 就没有参考价值了 。 所以我们今天所有的出发点都是基于代码 。
那代码它不是只有一个切片 , 它还有它的提交记录 、 历史版本 。 所以我们去分析它的当下切片和某一个切片和一些中间过程中的变更记录 , 然后呢 , 基于这样的一些信息去形成对整个这个代码库的这个理解 , 包括它的设计 , 它背后的思考经过多少迭代 , 它的时序是什么 , 关系是什么 , 业务架构是什么 , 整个的这个业务逻辑是什么 , 把这
东西生成出来 , 对吧 ? 那这样的话就有了一个超脱于以前所有文档的一个更高价值的文档 ,而且它这个每一行 , 每一个文档 , 每一行每一个字都是大语言模型生成的 ,也没有给人带来什么新的工作量 。
对 , 另外一点就是说随着这个代码库的一个变更提交 , 对 , 然后呢 , 它还可以去刷新这个文档 , 增量的去更新这个文档 。
对 , 所以说这个文档就是可以说是这个系统中最有价值的一个文档 ,但它是 AI 生成的 。
听起来这个真的很有需求 , 对吧 ? 比如说我们学计算机第一课 , 老师说要把文档写好 , 至少要把注释写好吧 。
然后我觉得在最开始工作的时候 ,其实就经常复盘会 , 然后工程师就会说 :" 哎呀 , 这一次这个注释没写好 , 所以我们效率不高 。"
然后我们就找个解决办法吧 , 下一次这个我们互相 review 彼此的代码 , 确保这个对方的代码是写了文档或写好注释的 。
但是往往事与愿违吧 ,在人性或者在老板的这个对速度的要求面前 , 我觉得几乎没有什么团队能够真的维护一个好的文档 。
那这个是一个如此显性的需求 。 那为什么之前比如说 Cursor 没有做 , 或其他的友商们没有做 , 这是一个第一个问题啊 。
第二个问题就是 , 如果有一天他们想做了 ,他们也能做到咱们的程度吗 ? 还是说我们有一些秘密配方 , 或者我们有一些独到的这个工程上的解决的思路 , 让其他人要追赶我们也没有那么容易 ?
肯定是没有那么容易的 ,因为其实如果说实现这个功能是比较容易的 ,但还是讲到刚才那点 , 就是说你如何多快好少的实现 , 对吧 ?
又比较便宜 , 效果又比较好 , 然后呢 , 又很能够理解它整个的这个历史的记录 。 因为我们其实有一整套规划 , 一个是说我们其实是定制了模型在做这件事情 。
对 , 然后呢 , 我们定制了自己的 Agent。OK, 对 , 然后呢 , 它一整套的 Repo Wiki 是有个维护的一个工作流的 ,也有一个它使用的工作流 。
所以它对我们来讲 , 它是个体系啊 , 它是深度融合到开发者的工作过程中的 。 因为这里面技术上我们做了很多的定制 , 然后从业务场景上也是一样的 , 就是我们如何去让开发者 , 就是它把它变成一种沟通协同的工具 。
比方说今天我们想要去交接一个工作 , 交接一个模块 , 或者有人要离职 ,有人要入职 , 要学习一个系统 , 它都可以从这个文档开始 。
对 , 所以说我们定义了一整套的这个逻辑 。 还有就是说 , 当然如果说这个团队有 10 个人在开发这个系统 , 我们也不需要生成 10 次 。
所以我们又构建了一个跟 Git 仓库去结合 , 去这个做共享和导出的这么一些能力 。 所以说今天它不是一个原子化的能力 , 它是一个一整套的工作流 。
对 , 所以说这样的话 , 它就形成了一些体系化的一些壁垒 。
OK,而这个工作流可能和 Qoder 其他工作流是有些耦合的 。 对 , 它也很难这个 , 如果我说我做的话 , 没有那么容易 。
对对对 , 包括之前我们刚上线的时候 , 生成一个这个 Repo Wiki 可能要 60 分钟 , 那现在我们最新的版本可能一下就缩短了 5 倍的时间 。
对 ,但是确实它这个产生的这个 token 量特别大 , 所以说也确实要花不少时间 。 但是其实我们因为正是因为我们有了这种定制化模型的这个能力啊 , 对 , 所以我们可以有几倍几倍的一个效能提升 。
我有一个好奇啊 , 就是我们都知道这个 Repo Wiki 生成出来的还不错嘛 ,但是你们在做它的过程中怎么去就是评估呢 ?
比如说我们生成一张图好不好 , 或回答一个问题好不好 , 这个非常容易 , 人就做出了判断 。 但是比如说我给你一个代码库 , 你给我搞一个文档出来 , 我来判断这个文档好与不好 , 这个判断的难度是非常大的 。
而且这还不是只针对一个代码库 , 你要做这样的判断 。 因为今天这个你可能要测几百个甚至上千个代码库出来的这个 Repo Wiki 好不好 , 那当时你们这个内部的评估的工作是怎么去设计的呀 ?
是这样的 , 对 , 这个是个非常好的问题 。其实今天大语言模型这个领域都面临这个衡平的问题 。
对 , 就是说到底谁好 ,在什么场景下, 哪些 case 下谁好 。 对 , 所以呢 , 一个是说跟自己比 , 就是我这一版是不是比上一版好 , 一个另一个比法就是说我自己定制化的模型跟可能海外比较优秀的模型去比 , 到底谁生成的好 。
对 , 那生成的好与不好呢 , 一个是有一部分人来判断 , 那有一部分呢 , 就是说我们也是通过一些跟这个强化学习一样啊 , 去比这个就是有一个奖励模型 , 哪些东西是好的 , 哪些东西采纳率比较高 , 哪些东西看的比较多 。
对 , 然后呢 ,也可以有一些用户标注的一些能力 , 通过这些其实就能标识出来到底这个东西是不是又进步了 。
对 , 那对于这个最开始的一个版本呢 ,其实我们就是看我们自己的模型跟海外的模型谁生成的好 。 对 , 那其实这个就是有一些人的这个工作在里面 。
OK, 对 , 那你们接下来比如说今年短期之内 , 希望在下一步很快实现的目标是什么 ?
其实我们核心的思路还是提升产品的能力 。 对 ,因为其实我可以那个分享一个我们这个 Quest Mode。 对 ,Quest Mode 不是讲它 , 它是一个自主编程嘛 。
技术深潜47:55
对 , 就是我们对于未来这个开发者的工作形态的一个定义或者一个预判 , 就是更多的开发者会使用这种自主编程 , 就是人当 leader, 然后呢 ,Agent 干更多的活 。
对 , 那其实在这过程中我们就发现说这里面有一个天花板 , 天花板就是人的工作时间 , 还有人的电脑 。
对 , 就是说我把电脑合上了 , 我就不能工作了 ,但是我希望 AI 还能继续工作 , 然后我下班了我就不能工作了 ,但我也希望 AI 还能继续工作 。
对 , 所以在这种情况下, 就是说我们的 Quest Mode 就延伸出去了 , 我们构建了云端的沙箱环境 , 然后再通过 Spec, 把 Spec 和我那个代码库发到云端 , 然后呢 , 它可以在云端长时间工作 , 包括我休假了 , 它还可以继续工作 。
所以说而且呢 , 我还可以起 10 个异步的沙箱 , 大家 10 个并行的在做 。 对 , 然后它跟我的工作和生活习惯是异步的 。
对 , 所以这样的话 , 我就像用我一个人带了 10 个 Agent 啊 ,在完成一组需求 , 然后呢 , 我的生产力提升了 10 倍 , 它又没有影响我的这个工作生活平衡 。
对 , 所以说对于这种模式 , 它就我们认为就是说它是真正能带来为了打开这个时间和空间的限制 , 它是真正带来 10 倍生产力提升的这样一种模式 。
所以我们也发布了这样的这个能力啊 。
其实 Cursor 也有 Agent 模式 ,但听起来就咱们 Qoder 和 Cursor 在 Agent 的都叫 Agent 的这个模式之下, 还是有很大的不同的 , 对吧 ?
就咱们是云端沙箱 , 可以多线程 , 就是除了这个不同 , 还有哪些不同啊 ?
它也支持了一个云端的模式 。 对 ,但是大家的实现方式不太一样 。 对 , 包括它可以在远程启动 IDE 啊 。 对 , 那其实我们呢 , 就没有远程 IDE, 所以我们远程呢 , 就是一个运行环境 。
这样的话其实会比较灵活 , 然后它的那个时效性也比较好 。 对 , 就是我其实不太需要 IDE 中很多的这个插件啊 、 工具啊 。
对 , 我们只要把这个智能体迁移到云端 。 对 , 这样的话对于我这个可以起很多并行的沙箱 , 然后可以并发出很多任务 , 就比较有帮助 , 资源消耗也比较省, 启动也比较快 。
对 , 所以说大家在路径选择和实现方式上会有很大的不同 。
所以你会觉得这个用户和 Qoder 之间的关系是用户是老板 ,Qoder 就是一个未来独立编程的一个 Agent。 对 , 对吧 ?
其实 Devin 和 Manas 都有类似的这个设计理念 , 然后我觉得他们俩都有一个共同的功能 , 就是如果一个这个 Agent 干活干的比较久 , 我就可以去问他 , 我说你现在在干嘛 , 为什么让我等了那么久 。
然后 Devin 和 Manas 都可以来回答这个问题 , 就像我好像真的去问我的一个下属 , 然后他会立即停下手中的工作 , 扭过头来给我做一个快速的汇报 。
汇报完了 , 我可以调整一下他的工作内容 , 然后你可以说行 , 你继续 。 对 , 然后一个是 Qoder 支持这个功能嘛 , 然后另外一个就是我比较想知道 , 就你怎么看未来不只是 AI Coding 啊 , 就整个 AI 领域 , 人和 AI 会变成什么样的关系 ?
我们也支持类似的功能 。 对 ,因为其实当它在长时间的做一件工作的时候 , 它可能会跑偏 。 对 , 然后呢 , 另外就是说它可能会耍些小聪明啊 , 跳过一些任务呀 , 这都是很容易出现的啊 。
所以我们一方面去约束它的行为 , 我们在任务最开始的时候就制定一个 to-do list, 我们的 Agent 它必须严格按照制定好的 to-do list 去执行 , 它不允许跳过和这个没做完告诉你它做完了 , 这个在我们这里是不存在的 。
它一定会按照这个来 。 另外就是说在执行很漫长的一个任务的过程中啊 , 对 , 然后呢 , 它就可以过程中我们去询问 , 然后呢 , 它可以不断的去把它的工作流输出出来 , 让我们去询问它 。
对 , 然后呢 , 过程中可以给它一些新的一些指示和要求 , 对 , 来纠正它的行为 。 对 , 所以我们也提供了这样的一个能力 。
对 ,也是担心说跑了很久 , 跑了三四个小时, 最后生成的结果从中间就已经跑偏了 , 这个对大家都是一种浪费 。
对 , 所以我们是构建了这方面的能力 。
那你会认为未来人和 AI,不只是人和 AI Coding 啊 , 你会觉得他们会是就什么样的一个共生关系呢 ?
但我觉得还是想从 Coding 来讲 。 对 ,因为我们还是有个观点啊 , 就是说 Coding 这件事情呢 ,其实它会变成这个大语言模型的一个双手和执行器 。
对 , 然后呢 , 它会变成一种这个所谓的数字世界和物理世界的一个连接器 。 对 , 它会去帮助人去做很多复杂的任务 。
那其实人呢 ,在这里面一定是成为一个管理者 。 对 , 然后他能够去提出明确的要求 , 然后呢 ,他就会有不同的智能体啊 , 对吧 , 去理解和协同来完成这个任务 。
对 , 所以说那未来其实更多 , 比方说有竞争力的这个 , 我认为职场中或者是这个商业社会里面比较有竞争力的一些人, 肯定是能够去充分的去驾驭这些 AI 的 。
对 , 然后呢 , 能够把大家管理好 、 协同好 , 然后找到一个场景 , 找到一个业务形式 , 然后能够把这个业务价值做出来 。
所以说今天为什么会有很多一人公司嘛 , 我觉得它就代表了未来的一种这个人和 AI 之间非常好的一个协作关系 , 形成很多非常有创造力的组织 , 然后很多工作都是由 AI 之间互相协同来完成的 。
可能这是未来成为一个主流的组织形态是有可能的 。
虽然叫 Qoder,但是你们会只做 Coding 吗 ?
我们目前肯定是只做 Coding,但我们认为其实整个这个产品的形态和它覆盖的场景还会非常的这个有非常大的一个外延 。
就是我们讲的 , 今天我们是从下到上去构建这个产品能力 。 对 , 所以说在模型之上去做优化 , 对吧 , 去做定制也好 , 然后去做这个上下文工程 , 然后形成大量的 Agent 和工具 。
那其实当我们这个能力做到比较领先的时候 , 那我们上面的 , 我们上面的产品形态和产品的这个界面 , 它有什么可能延展的 ?
它绝对是可以延展的 。 因为 IDE 它只是一种形态 , 它今天代表的是我们的专业开发者的工作的核心界面 , 它是个最大工具树 。
那那个 CLI 呢 , 它代表的是说是一些这个更专业的 , 对吧 , 或者是要自动化的一些这个开发者的一些界面 。
对 , 那我们还是会把这个 Agent 它会集成到很多的这个流水线呐 , 定制化的场景啊 , 甚至说你的手机啊 , 对吧 , 你的一个可能作为一个 APP, 对 , 它在里面都可以去唤起一个 Agent 去为它工作 。
对 , 所以说这个形态上就会有更多的这个展开 , 对吧 , 那从场景的角度也是一样的 , 就是说今天每一个小的需求都可以被满足 。
对 , 就是大量的场景会数字化 , 对吧 , 另外一点就是说很多复杂的这个任务可以让 AI 挑大梁来做 , 这里面我们的 Agent 它就会成为它的一个执行器 。
对 , 所以我们的场景也会充分的打开 。 对 , 所以说绝不是说未来只有一个 IDE 啊 。
感觉你们更像就是 Claude Code 承载了这个使命跟可以想象的外延 。
对 ,因为我们还是希望把自己定位为说是模型之上的一些编程智能体 。 对 , 所以说我们的 IDE 是一个编程智能体 IDE 平台 , 我们可能还有编程智能体 XXX 平台 。
就在我们录播客的前一天 , 我们注意到 Qoder 刚发了 CLI, 就命令行的模式 。 对 , 所以很想这个请教一下, 就是你们发它的这个背景啊 , 就内部的一些思考是什么 ?
就刚才已经提到了一些 , 看看有没有补充 。 然后另外就是也会很关心 , 一个是和 Claude Code 有没有竞争 , 如果有的话怎么竞争 ?
那我们先讲一下说我们为什么要构建这么一个形态 。 对 ,其实还是回到说我们做 IDE 啊 , 实际上是希望把这个 Coding 能力以一个大家最普遍的工作界面提供给开发者 。
对 ,因为大家其实最广谱的开发者还是以 IDE 作为他的工作界面嘛 , 对吧 , 所以我们很自然的要去做 Coding 这件事情 , 就会去做 IDE。
对 , 然后呢 , 然后在这个形态之外呢 , 就是其实我们也看到就是用户这个开发界面的这个场景啊 ,是非常多元化的 。
对 ,因为其实就像我们这个开发者 ,他不是说一周 7 天 、 一个月这个 24 天 、21 天都在做 Coding 一样 ,他还有不同的这个工作 , 对吧 ,也在不同的平台去承载他的工作 。
对 , 包括那个有些工作他可能要去写些脚本呐 , 对吧 ,有些可能要做些维护啊 , 通过命令行的方式做一些工作 , 做些事啊 , 或者做一些流水线的集成 , 或者在一些平台上去做一些这个工作的开展 。
对 , 那这个过程中其实你在 IDE 里它是一个全封装的一个形态 。 对 , 它就没有办法把这个智能体外化出来 , 对吧 , 它是封死的 。
对 , 所以呢 , 我们就需要去把这个智能体以一种灵活的方式能够被集成 。 对 , 所以我们的命令行就承载了这个像命令行的形态 、 脚本的形态 、 被集成的形态 。
对 , 然后呢 , 甚至来讲 , 比方说 WEM, 就是它有很多的这个不同的开发者啊 ,他在用不同的 IDE, 我们不能说假设说所有的开发者都在用 VS Code, 这个假设根本不成立 。
对 ,但我们的 IDE 是基于 VS Code 的 , 所以你天然就放弃了很多开发者 。 但是我们的 CLI 就能够服务于理论上, 它能服务于所有开发者 。
对 , 所以说它是打开了一个更广泛的一个客户的群体 。 对 , 所以从这些角度 , 我们是一定会推出这么一个形态的 。
对 ,因为我的目标是服务于广谱 , 服务于更大的这个用户规模嘛 。 对 , 那第二个呢 , 就是说我们怎么跟 Claude Code 去做这个竞争啊 。
对 ,其实我们也认为它不是一个单一维度的竞争 , 命从模型的角度 , 对吧 , 还有成成本的角度 , 就是它其实它在上下文构建上比较的简单粗暴 ,但效果非常的好 。
对 , 那我们其实做了很精细 , 对吧 ,因为有的时候我们会发现 , 如果我们不用自己家的模型 ,因为别人模型是很贵的 , 所以它不存在这个问题 , 对吧 , 所以我们必须我们不能在一个维度上去竞争 。
所以我们在上下文主张上做了很多工作啊 , 这一方面 , 包括对于 Agent 它的灵活性的定义上, 包括一些 Sub-Agent 的一些这个设计上啊 ,其实我们都有一些这个自己的实现啊 。
对 ,但另一点 , 另外一点我们还是希望说我们是多场景渗透 , 我们是会做场景 , 做场景恰恰是我们擅长的 。
对 , 就好比说我可以在手机上去安排一个工作 ,在 Slack 里 ,在 IAM 里去跟进和安排一个工作 ,其实都可以 。 对 ,但这种场景化 , 它都能够去满足一部分用户的这个刚需 。
对 , 所以说这种情况下 ,因为我们是做应用层的嘛 , 那其实做模型厂商他就不会去搞这些产品形态的一些创新 。
所以说这样大家就会有一个差异化的一个定位 。
其实刚才我们有多次提到上下文工程啊 , 就是听起来是 Qoder 在上下文这里做了不少的工作 。 这里可不可以稍微展开讲一讲 , 就是有没有一些具体的一些你们的心得 , 或者你们优化上下文的一些方法论 , 可不可以拿出来分享 ?
对 ,因为今天其实我们要去构建一个比较好的上下文工程 , 一定是我们讲的都快好省了 , 对吧 , 一定要做到这样的效果 。
对 , 那其实另外一点就是说 Agent 它跟工具 , 我们设计哪些工具 , 还有哪些技术实现方案 , 能够达到这样的效果 。
对 ,因为其实本质就是驱动大语言模型工作嘛 , 干活嘛 。 对 , 所以在这个角度上, 我们其实做了比较多的这个探索 , 包括从这个 , 比方说我们讲的这种相关性检索 。
对 ,因为今天你不可能每一次问题都把所有的内容都丢给它 ,因为这个非常的消耗成本 , 消耗时间 。
所以说我们一定要找到这里面的相关性 , 对吧 , 那你到底是用向量化的这种检索呀 , 还是用这种文本化的检索 ,其实这个就不一样 。
那要不要加语义的检索在里面 ? 对 , 所以说就是每一个就是相关的这个问题 , 都会找到一个自己的实现方式 。
对 , 那到底是用 Agent 还是 Sub-Agent, 到底用哪种方式来去完成这些工具的一些调用啊 , 完成一个上下文内容的一个聚集啊 , 然后再拼出一个比较合理的上下文 。
这上下文绝不是越长越好 。 对 , 然后呢 , 再跟模型互动 , 拿到一个结果 , 然后呢 , 可能不断的循环调用工具 , 那最后完成一个任务 。
对 , 所以就在这过程中, 就是要做到我们讲的都快好省 。 然后呢 ,有多元化的一种工具选择啊 , 还有就是 Agent 的实现方式 。
另外我们还做了一些像这个记忆的一些构建 。 对 ,因为我们认为记忆也是非常关键的 , 就是因为比方说一个用户在跟模型交互 ,在跟我们上下文工程交互的过程中啊 ,他会给你非常明确的指示 , 这种指示可能是潜移默化的 , 对吧 ,因为他不会在提示词里写清楚 ,他会说这个不是我要的 , 这个是我要的 , 我喜欢什么 ,不喜欢什么 。
我们会把这些东西快速的抽 , 快速的抽象出来 。 对 , 然后呢 , 变成一种这个我们的规则 。 对 ,有的可能变成系统提示词啊 ,有的变成了这种记忆 ,而这种记忆就会约束下一轮以后所有交互的这个模型的行为 。
对 , 然后这样的话 , 就会保证我们又能够有一个不那么快的上下文的一个增长 。 因为上下文增长越快 , 你越消耗成本 , 又能保证我们有一个比较好的一个效果 。
然后呢 , 能够让开发者觉得这个工具越用越懂我 ,因为我原来的行为习惯变成他的行为规约了 。
对 ,他就没有没有把这件事情说明白的时候 , 对方已经学会了 , 形成默契了开始 。 对 , 所以我们在这方面做了很多的一些探索和一些创新啊 。
咱们刚才讲到这个 Memory 的 infra, 讲到也用了沙箱 , 然后其实还有就是做 to-do list, 对吧 , 这些都是咱自建的 , 还是也用了一些开源三方 ?
都是自建 , 所以这也是需要这个团队在这个领域有比较深的理解和积累 。
职业建议1:01:33
对 , 我们这期节目会在 1024 程序员节那天播 , 是一个比较个人的问题啊 , 就是如果你今天回到自己刚刚工作那个时候 , 你已知后来的世界发生了这么多的变化 , 现在回看那个时候的自己会有什么感触吗 ?
对 ,其实我是觉得呢 , 对于每一个工作者或者叫职业工作者来讲啊 , 就是还是要有一定的这个预判性 。
对 , 就是说我们要去感知说未来会发生什么样的一些变化和趋势 。 对 , 就是我们不要为过去的一些事情去买单 。
对 , 还是要为未来即将发生的事情去买单 。 我觉得还是希望能够勇敢的去迈出这一步 , 对吧 , 做出一些主动性的选择 ,而不是说去被动性的被推着走 , 对吧 , 还是有选择的去走 。
这个世界的容错率也很高 , 大家应该去勇敢的迈出这一步 。
那你自己作为一个做了这么久程序员的人, 你自己在做这个产品做下来的感受是什么呀 ? 就是有一种自己在革自己的命的感觉 。
我倒没有说去做一个革命性的一个工具啊 ,其实我们更多的还是认为说在给未来的程序员去探索一条发展的路径 。
对 , 就是未来的这个开发者也好 , 甚至泛开发者也好 ,他需要什么样的工具 , 然后什么样的工具能够产生更大的这个商业价值 。
我们从这个角度来思考 。 然后呢 ,其实今天我们不做也是一样的 , 这它一定会发生的 , 就是大家的工作的方式 、 组织的协作关系都在发生变革 。
对 , 所以我们希望说是以一种能够更加面向未来的 , 然后更懂开发者和更懂未来这个组织生产关系和协作方式的一种 , 对吧 , 一种姿态或者是一种视角切入 , 对吧 , 然后去探索出一个给开发者未来更有发展的这么一个平台啊 , 对吧 ,是从这个角度来看 ,而不是说简单的去说以后程序员都不需要了 ,以后都是我们工具在做 。其实我非常不认可这
个观点 。 对 , 一定是人跟这个 Agent 去这个协同去工作的这么一个形态 。其实我觉得跟我们这么多年做这个开发者 , 我认为啊 , 就是说一个优秀的开发者还是要站在技术的肩膀上 ,而不能成为技术的奴隶 。
对 , 什么叫站在技术肩膀上呢 ? 就是所有的技术要为我所用 , 然后呢 , 创造更大的产能 , 创造更大的这个商业价值 。
对 , 所以说就是我们讲的跟技术要红利 , 你要到了 , 你就是这个 , 对吧 ,也是这个弄潮儿 , 要不到可能就被那个淘汰了 。
对 , 所以我们还是说把这个 AI Coding 的能力把它平民化 , 让它一个很简单的获取 ,但是不能主动拥抱 ,不能够很好的去驾驭的 ,也是会很有问题的 。
那你会怎么看待这个 AI 会取代程序员这件事呢 ?
我相对来讲还是比较乐观的啊 , 就是不觉得说 AI 会取代程序员 。 对 , 然后首先呢 , 就是说程序员还是要能驾驭 AI。
对 , 然后呢 ,他把 AI 当成一个巨人, 然后呢 , 我们站在他的肩膀上, 然后呢 , 去创造业务价值 。 对 , 那这样的程序员其实都是很有前景的 。
这是一个点啊 。 另外就是说不是有个这个杰文斯悖论吗 ? 就是这个当你这个成本变低的时候 ,他的需求会被打开 。
对啊 , 所以说他这个需求变成海量以后, 大家都可以低成本的去做很多的创作 , 对吧 ,但是呢 , 那这里就出现了很多的泛开发者 。
对 ,但是泛开发者就可以做些小的 , 对吧 , 小创新 , 或者是满足一部分群体的 。 那专业程序员就可以做一些大创新 ,因为他还是具备他的专业性 。
对 , 所以说从这个角度来讲 , 程序员的数量可能会变多 。 对 ,但是还是要去能够借助 AI, 可能如果能爆发出 5 倍 、10 倍的这个生产力 ,他一定是说更有这个前景和竞争力 , 对吧 , 如果说做不到的话 , 那可能他就变成一个普通的程序员了 。
对 , 所以整体来讲我们还是比较乐观一点 。
那你们自己内部的开发方式现在是什么呀 ?
我们团队也都是很多的这个日常大比例的在用 Qoder 这个产品 。
用 Qoder 做 Qoder?
对 , 我们也有这样的要求 , 就是说你的这个代码生成有多少是 AI 生成的 , 我们有这样的一个明确的要求 , 就逼着大家去革新自己 。
不是革命 ,是革新自己 。
这是从什么时候开始的 ?
从牛马时代就开始了 。
那你会觉得未来这个工程师们的核心竞争力会从编码能力改变成哪些能力呢 ? 一定是跟复合的 ,有抽象过会变成哪些能力吗 ?
我们还是认为说这个领域开发者定义会变得很宽泛啊 。 那以前开发者可能他分类的 , 比方说我是做后端的 , 那他是做前端的 ,他是做那个 iOS 端的 , 那谁是做这个数据库 、DBA 啊等等 , 分工精细化 , 当然现在已经不存在了 , 对吧 , 就后端工程师也可以搞前端 , 前端也可以搞后端 。其实因为大语言模型给你很强的这个这个抹平这个差异的能力
嘛 , 对吧 , 所以从这个角度 , 个体能力已经被极致的放大了 , 打破了很多的边界 。 对 , 然后另外呢 , 那其实打破第一重边界以后, 可能还有第二重边界 , 就是说因为他的写代码能力已经比人强了 , 你不能跟他比写代码能力 , 无论从这个产能和这个效率 , 你都不能跟他比 。
那这个时候就是要充分调动他 , 那人就要往上走一层 , 就是我们讲的需求洞察 、 意图识别 , 然后呢 , 要求的描述 、 整体性的设计 、 结果的验收 、 产品实现等等 , 把这些东西变成一种能力 。
所以每一个开发者未来都是一个复合型的人才 。
所以如果今天就是要让你给 , 比如说这个程序员们 ,以及给这个大一的计算机新生 , 就这两种群体不同的一些建议的话 , 就这个建议是为了帮助他们在今天这个 AI 时代更好的这个获得事业上的进步 , 你会分别给什么样的建议 ?
对 , 我们就讲说对于这个大学一年级的这个计算机的同学啊 , 对 , 我们觉得还是第一个呢 , 还是要充分的去拥抱 AI, 然后呢 , 去探索 AI 能为你做的事情的边界 , 要把它充分用起来 , 然后做一个会驾驭 AI 的人, 对吧 ,也就是第一方面 。
第二方面呢 , 我还是认为说一定要充分的去学习计算机的专业知识 。 对 ,因为今天其实计算机的体系结构并没有发生革命性的变化 , 对 , 那现在还是 Fong Yi Man 的这个体系结构啊 。
对 , 然后呢 , 今天还是这些操作系统 ,Linux 啊 、Windows 啊 、Mac 呀 , 还是这些操作系统 。 然后呢 , 如果不了解这些结构的话 ,其实你是没有办法去校验他做的东西好与不好的 。其实他你不知道他做的好不好 , 你就没法驾驭他 ,他可能在忽悠你 , 对吧 , 所以说一定要有这个专业性 。
对 , 那另外一点就是说他也不是什么都能做 , 对吧 , 比方说大语言模型就没有创造大语言模型 。
对 , 比方说我们今天 , 我们的 AI Coding 产品可以做一个 iOS 的 APP,但它做不了 iOS,因为它足够复杂 、 足够顶层设计 、 足够少见 。
对 , 所以说它还是有很多不能做的事情 。 那其实不能做的事情就是附加值最高的部分 ,因为以后可能一个软件可能就值 5 毛钱 , 对吧 , 尤其一个比较简单的一个创意 idea, 它是不值钱的 。
如果你说我也能做 , 对吧 , 那谁都能做 。 所以它就没有什么竞争力和附加值 。 所以要去学习提升专业性 , 做一些他做不了的工作 。
对 , 这个是保持一个好的职业发展啊和未来更有创造力的工作 , 我认为它是必须的 。
那你觉得在一个大厂里面成长的一个工程师 , 就是在这个职业发展上需要的技能是什么 ?
我认为对计算机相关的同学来讲 ,其实还是一个第一 , 它是个蛮好的时代啊 。 对 , 就大家以前大家都讲说程序员不够了 , 对吧 , 就是开发不出来 , 所以又要延期了 。
以后这种事可能就不存在了 , 对吧 , 就是打破了自身的瓶颈 。 对 , 这是个蛮好的现象 。
现在突然觉得好开心啊 , 之前那个各种项目延期真的是最痛苦的来源 。
你 PD 出时可是很有感觉的 , 哈哈哈 。 然后另外另外就是说什么呢 , 我认为今天恰恰是程序员有优势的地方 ,因为因为程序员其实你过去 20 年、30 年来讲 , 这个行业发展很快 , 每一个人都在快速学习 , 所以说程序员根本不在乎再多学一个东西或者把一个东西学精 , 每个人都有这个能力 。
对 , 所以说这反而成为大家的优势 。 对 , 所以我对这个群体是最有信心的 , 再去拥抱这个 AI 时代 , 创造更大的这个产能 , 这个这个方向 。
那你可以说说你自己吗 ? 就是因为我觉得看你的经历 , 就是那种怎么说呢 , 就是搞过双十一架构这种巨庞大 、 巨挑战的事情 。
双十一故事1:10:13
连续 8 年,9 年,9 年的双十一不当机是靠你在背后 。 因为我我之前在聚美的时候负责移动事业部嘛 , 然后那会也是一大促就当机 , 然后那会我们就是有一年大促前的前一天晚上, 几个工程师甚至跑到那会的机房去上香 , 实在没办法 。
后来成为了一个这个表情包 , 我们特别爱发那个表情包 。 对 , 所以可以讲讲当时的一些故事吗 ?
其实也不能说是说靠我和我们的团队啊 ,其实还是整个公司在这里面有很多投入 ,有很多的优秀人才一起来贡献 。
对 ,但我其实加入的时候呢 , 正好是双十一快速起量的一个时候 。 对 , 然后呢 , 咱们讲说双十一比日常有一个百倍的流量增长 ,其实每一个系统都撑不住 。
对 , 然后当时的一种工作方式呢 , 就是每一个人负责一个系统 , 或者没几个人负责一个系统 。 对 , 那就大家其实就各管一摊嘛 , 就铁路警察各管一段 。其实大家拼起来的时候啊 ,是很容易散架的 。
对 ,但日常没有问题 ,因为日常大家都有很大的余量 。 对 ,但是你说百倍的流量 , 我又不能用百倍的成本来解决 ,其实你用百倍的成本也解决不了 ,因为还是大家是一个还是一个积木嘛 , 就没有非常强的连接和互相的匹配 , 这里面有很多的瓶颈 。
对 , 所以我们当时在中间件啊 ,在整个的这个压测呀 , 对吧 , 容量管理啊 , 自动化的运维和弹性啊 , 做了全方位的技术升级 。
对 , 那是在 13 年的时候 , 就是我们开创性的提出来 ,也是全球第一个提出来 , 就是我跟团队啊一起做了一个叫全链路压测 。
对 , 今天也成为所有的互联网服务的一个标配 。 对 , 所以说有了这样的一个技术以后呢 , 就是说能够达到一个什么样的平衡呢 ?
就是说整个系统中是没有瓶颈的 , 对吧 , 如果瓶颈来了 , 或者叫超过我的处理能力了 , 我就不把流量放进来 , 只要放进来的我都能处理 。
然后呢 , 什么叫没有瓶颈 ? 就是如果都跑满的情况下, 每个系统都是满的 , 就不会出现说有个地方很资源很冗余 、 很丰富 , 别的地方已经满的不行了 。
所以我们把几百上千个系统能够保持一致的水位 , 对吧 , 然后呢 , 每个系统都不会挂 , 挂就挂在外面 , 让流量不进来 。
对 , 所以说做到把一个全局架构做到这样一个程度啊 , 就是就从这个很大程度上就解决了这个双十一的一个问题 。
这个听起来现在讲起来非常云淡风轻 , 几句话就讲完了 。 但我想当时其实遇到的阻力不只是技术阻力 , 这里头因为涉及可能几千个工程师 , 然后他们本来每个人也有自己的 OKR, 然后为了配合你们的这个构想 , 还要花很多时间去改造它 , 然后这个和可能和他当年的 OKR 之间也没有什么直接间接的关系 。
那这个在内部的沟通工作是怎么做的呢 ? 你是如何实现的 ?
因为是这样的 , 首先大家还是有个共同的目标 。 对 ,因为大家都在做双十一 , 确实有成百上千的工程师在做啊 ,但大家有个目标就是双十一不要挂 , 这个目标是 , 对吧 ,是这个前提 。
另一方面呢 , 就还有个非常好的地方 , 就是说我们还是有个一体化作战 , 就是说整个双十一优先级最高 。
对 , 然后另外就是说它有个 deadline,因为软件这个事情可以延期的 , 双十一是不能延期的 。 对 , 所以说在这些多重因素的这个驱使之下吧 , 就是还是能够去协调一些资源 。
但我们其实 , 我们作为一个驱动者和一个协同团队和一个这个方案的提出者 , 我们是要给整个事情兜底的 。
就什么叫兜底呢 ? 就是说我能够驱动的资源我们就驱动 , 驱动不了的我可以上, 我帮你做 。 对 , 就是说就是因为这个时间就摆在那里 ,deadline 就摆在那里 , 这是不能延期的 。
对 , 所以我们什么方法都用了 , 或者是说我自上而下去推动 , 或者是自下而上, 就有各种方式去推动 。
另一方面还有一点 , 我认为还是我们很有优势的一个地方 , 就是阿里在很早以前就做到了技术的统一化 。
对 , 如果说今天我们要做这件事情 , 大家是不同的技术站 , 这边是用 Python 的 , 对吧 , 那边是用 Gode, 这边是用 Java 的 , 那边是用 C++ 的 。
完蛋 。
对 , 很难做 , 很难做 。 对 , 所以这也是我们技术统一以后带来的一个红利 , 我们的迭代 , 对吧 , 可以一改一大片 ,因为我们有很多的优秀的中间件 。
对 , 所以我们就这件事情其实三个月就做完了 。
哇 。
对 , 所以说就大家也很有成就感 。 对 , 然后呢 , 贡献也蛮大的 , 然后它成为今天成为一种标配 , 现在还在发挥作用 。
对 ,但实际上我们一起参与这件事情的人都得到了非常好的成长 。
我非常好奇啊 , 就是比如说当时在聚美的时候 , 那几年每次大促前夜 , 我们是真的 , 我感觉没有一个人知道大促开始之后会不会当机的 , 真的没有人知道 。
那个时候我算是这个业务比较重要的高管之一 , 然后呢 , 我们就会在这个工程师的作战室里面待着 ,但是我就感觉现场的工程师也都没有人知道接下来几秒钟 , 对吧 , 十九八七会发生什么 。
我觉得所有人都是真的就是有一种祈祷的感受 。 但我就好奇这个 , 对吧 , 作为阿里巴巴 , 你们在同一时间在另外一个作战时, 大家的心态是什么 ?
是会和我们类似吗 ? 还是会 ?
紧张肯定是紧张的 。 对 ,因为为什么 ? 因为我们其实是在我们的理念叫在双十一之前创造双十一 。
对 , 就是说比如说双十一今天有 。
预演过很多次了 。
对 ,而且这个预演是真实流量 , 真实的用户动线 , 真实的用户请求 。 对 ,但是这里面的挑战是什么 ?
就是你所谓的真实 ,不是双十一零点的真实 , 就不够真 ,不够真就会出现很大的一个影响 。 对 , 所以我们也非常紧张 。
对 , 就是我们前期比方说我们做三次真实演练 ,50 万每笔的一个交易 , 我们就在某一天的这个零点 , 对吧 , 我们就开始直接 50 万就来了 , 一秒钟起来 , 就跟双十一一模一样 。
然后呢 , 就会发现这里有很多问题 , 然后呢 , 我们就去排查 , 对吧 , 哪些是技术瓶颈 , 哪些是并发问题 , 哪些是容量问题 , 哪些是弹性问题 , 然后去把一个个解决 。
然后下次再压 , 发现这些问题就没了 , 没了之后又出新问题 , 然后我们就再把问题问题修掉 , 可能压到第三次 、 第四次 , 这些问题就收敛了 , 就没有了 。
没有了是不是就意味着说 , 那我们就等待双十一到来了 ,是不是就高高枕不忧了呢 ? 也不是 ,因为随着这个运营活动 , 还有就是说有些爆款 , 还有我们原来的那个测试啊 , 或者是验证的这个数据的流量 , 那种分配不够 , 这个模拟啊 ,不够真实 , 对吧 , 所以就会出现一些错配 。
错配其实就意味着说你整个系统的动态调节能力 、 自我修复能力是不是要够强 , 对吧 , 所以说我们从这个资源 、 流量 、 容量各个方面是有动态性的 。
对 , 所以但是如果你在高压力下去做这个调整 , 又会产生新的波动 。 对 , 所以我们依然是很紧张 ,但是其实从 13 年以后没有出过什么太大的问题 , 都是小问题也是接连不断的 。
对 ,但我们认为这也是肯定会发生的 。
太强了 。
那你每年那个双十一结束的那个时候 , 你的心情是什么 ? 有那种 ?
有的时候有运气的因素啊 , 所以我们也比较喜欢这个 。
去灵隐寺 。
哈哈哈 , 对对对 ,有的有的有的 , 这也成为成为我们的一种文化了 。
对 , 就双十一之前要去灵隐寺拜一拜 。
是是是 。
当做团建了 。
是一种团建 ,也是一种放松的一种一种方式 , 大家压力都很大 。 对 ,也是找一个心灵寄托嘛 。 哈哈哈 。 就那一秒过去就知道这一次怎么样了 。
一般 10 分钟吧 。
那你每一年心情都一样吗 ? 还是比如说有有没有什么时候是你就是心情特别不一样 , 比如说只有想哭的感觉 ?
最开始嘛 , 最开始的时候其实压力是比较大的 , 就后面就越来越从容了 ,因为我们技术架构也是一代代往前发展 。
对 , 然后呢 , 每一代就会面临新的问题 , 然后呢 ,也会有新的机会 。 所以我们那你比方说我们解决了稳定性的问题 , 那后面就要解决成本的问题 。
那我们就不希望比方说比方说我 50 倍的流量 , 我可能要花 3 倍的成本 , 那我我们后面就定了个什么目标吗 ?
双十一肯定有 50 倍的流量 , 对于整个集团来讲 , 能不能不多花一分钱 ?
哈哈哈 , 这是你提的是吗 ?
不是 , 这是也是 CTO 提的 。
OK。
对 ,但是是我们帮他做到 。 所以所以这就是涉及到说我们为什么去搞这个容器化 、 搞元元生化 。
对 ,其实也是就是所以所以我们一直有一个 mindset 的 , 就是说永远要跟技术要红利 , 对吧 , 然后呢 , 技术驱动商业 , 然后呢 , 创造价值 。
对 , 我们一直我们就说阿里巴巴的技术人一直有这么一个追求 。 对 , 所以说提出这样的想法 , 我们也没有觉得这不可能 。
对 ,因为其实毕竟啊 , 毕竟这个业务里面其实有很多的业务板块 , 国内的 、 国际的 、 搜索的 、 广告的 、 电商的 , 还是飞书的 , 还是饿了么 , 还是什么 , 还是高德 , 对吧 ,其实大家有很多的业务 , 很多业务都有很多的资源 , 包括 UC 啊等等啊 , 包括模型 , 对吧 ,其实大家有很多的这个资源 , 它不是每一个业务都参与双十一的 , 对吧 ,但是每
个业务都不希望在里面受影响 , 对吧 , 所以我们在这里面就是说能够去通过这种调度 、 管理 、 弹性 、 通过容器这样的新的技术 , 能够把大家打通 , 对吧 , 能够产生一种分时复用 、 充分弹性 , 然后混合部署 , 包括数据类的 、 业务类的 。
对 , 然后通过这样的一些技术呢 , 就能够做到就是该缩的时候就缩 , 缩出来资源就给他们可能 20 分钟 、10 分钟 ,他们就都用上了 , 那他们用完了 10 分钟又还给我 , 我又用上, 对吧 , 就是很短时间内完成大规模集群的这种缩放 。
对 , 所以说包括云上也可以复用 , 各个业务板块都可以复用 , 然后这个小时跟下个小时也可以复用 , 对吧 , 把这个这些事情做到极致 , 就带来了海量的成本的一个结价 。
对 , 我觉得其实这今天都成为一个这个行业中一些技术的一些标准实现 , 对吧 ,也推动了像国内像容器化呀 , 像云元生技术的一个普及啊 ,因为大家对于效率 、 弹性啊 , 然后对于这个成本啊 , 对吧 ,其实都是有一样的需求的 。
对 , 双十一只是一个一个缩影而已 。
感觉真的很像每年一次高考 。 你刚说了 , 我感觉很像前面模拟考 , 先先来模拟几次 , 然后不停的查我哪块不会 , 然后我再改 , 对吧 。
那你是从哪一年开始不管双十一了 ?
我后面就开始
开始在做一件事情 , 就是说当我们把阿里的稳定性和成本做到比较高的一个水位的时候呢 ,其实我们也在考虑说如何把这些技术变现 , 然后能力溢出了嘛 , 就是说因为它是行业中的一个普遍的需求嘛 , 对吧 , 所以我们就开始做产品化 , 做这个赋能行业的一些用户啊 , 包括很多的互联网企业啊 , 很多的产业互联网的一些用户啊 , 对吧 ,其实是用
我们的这种产品化的技术去服务于他们啊 ,其实我做了好几年这样的一些方面的一些工作 , 就是负责一些产品啊 。
对 , 所以说后面就是逐渐就不去负责双十一了 。
那在到双十一的时候有什么心情吗 ?
放松更多的心情 。
哈哈哈 , 对对对 。
终于可以随便把给服务器猛加压力 , 现在终于轮到我加压力了 ,而不是我扛压力了 。
对 ,但但其实我们值班的时候也是猛加压力 。 哈哈哈 ,因为因为其实我们也希望业务大发展嘛 , 个人也是个消费者嘛 ,因为其实如果说系统都很稳定 , 或者是说你你也不知道这个零点会有多大的峰值 , 我们其实都在买买买了 。
对 , 如果系统出问题了 , 好 ,不买了 , 赶紧去处理问题 。 没问题 , 大家就一直买好了呀 , 反正也很优惠 ,也要抢一些这个前 100 单是有优惠的 。
哈哈哈 。
对 。
那你会有没有 , 我已经做过双十一这么大的项目这样子的事情了 , 我后面得再做一个什么事能让我获得这么大的成就感 ?
Coder。
哈哈哈 。 就是它到什么程度能跟那个匹配呢 ?
其实不能从这个角度来思考问题啊 ,因为其实对我来讲呢 , 还是觉得说要做有价值的事情 , 要做对这个社会有贡献 , 然后呢 , 技术进步 , 然后造福一些人嘛 , 对吧 ,其实这个就是我们价值感的来源 。
每一个人他都需要一个舞台 。 对 , 然后这个舞台呢 ,不是你想有就能有的 , 还要看说今天这个社会环境有没有给你 , 或你所在的平台有没有给你 。
另一方面就是你的能力是不是 ready。 对 , 所以所以所以我们其实当时也是做了一些判断和选择嘛 , 就是觉得我们的技术处理这些流量 , 这个还是独步全球的 。
然后呢 , 我们再大流量也不可能有了 ,因为中国人口红利也初定了 。 对 , 然后呢 , 我们有一套体系和方法论 , 它也不需要再去有太多的革命性的东西出来 , 对吧 , 所以我们当时就做了很多技术标准化的工作 , 包括我们做了大量的开源 , 对 , 包括像中间件的开源 , 云元生领域的开源 , 我们做了很多 , 然后呢 , 同时开始做商业化 。
对 ,也希望说技术创造新商业 , 对吧 , 能够通过我们的技术能够打开一个商业的局面 。 对 , 所以我们做了很多这样的工作 。
对 , 所以本质来讲就是说怎么把我们的技术创造更大的价值 , 寻找更大的舞台 。 对 , 那到到今天来讲 , 我们就是认为 AI 是最大的一个舞台和放大器 , 所以我们就做了这样的选择嘛 。
未来愿景1:23:49
两个月之后会觉得自己的选择怎么样 ? 就现在发布了两个月 。
很正确 , 无比正确 。
现在肯定不 。
无比正确 。 对 , 那还有我们最后一个问题 , 就是在你看来 , 比如说三年五年之后做到什么样的成绩 , 你会觉得就特别满意 , 然后你想象在那个画面里面 , 就是整个生态啊 , 就从程序员然后到用户 , 又会是一个怎样的一个画面 ?
其实我们畅想未来啊 , 就是说如果说三年以后我们的这个愿景能够达成啊 , 我们还是希望说在 Coder 这样的产品上呢 , 能够生产出最多的真实软件 , 就是具备商业价值的软件 , 能够覆盖最多的场景 。
对 , 这个场景也是能够通过软件产生更多价值 。 对 , 所以说这是从我们自身的角度啊 , 希望能够看到的 。
那另外从这个你说这个周围的世界会发生什么变化 ? 对 , 那我觉得还是回归到说大家相不相信 AGI 会到来 。
对 , 所以从我的一个个人的一个观点来看呢 , 我们还是希望说今天 Coding 成为一种这个通用能力 , 它通过智能体这个方式去这个外化出来 。
对 , 然后呢 , 那就像这个奥特曼讲的这个从从这个对话到推理 , 对吧 , 然后到这个 agent, 到创新 , 到组织 。
对 , 那我觉得三年这个时间窗口可能组织这件事情会发生 , 就是它可以形成一个这个可能这个 AI 多智能体的这种联动啊 , 它可以完成一个宏大的目标 , 长期的目标 , 复杂的目标 , 对吧 , 它可以去调用各种工具 , 跟现实世界去交互 。
对 , 就是说 Coding 能帮助它解决很复杂的问题 ,并且它带来的是确定性 ,因为大语言模型它可能回答和生成的那个内容 , 推理的内容它是不具备确定性的 。
对 , 代码能够带来的是确定性 。 对 , 所以它一定是说在未来世界中做很多的管理生产事件 , 它是一个很必要的一个选择 。
对 , 另外就是说它可以包括从需求端 , 可能大家的需求都得到充分满足了 , 对吧 , 然后肯定这里跑出来很多新的这个业务形态 , 对吧 , 新的创业型的业务 , 对吧 , 从场景端其实就是说比方说啊 , 今天比方说马斯克他登上了火星 , 那火星的房子肯定不是宇航员建的 , 肯定是 AI 建的 , 对吧 , 那肯定是跟大语言模型 , 还有 agent, 还有这
个什么机器人它一起驱动这件事情发生的 。 那我是比较相信说这一天它会到来 , 然后 Coding 在里面会发挥很重要的一个作用 。
谢谢叔同来做客十字路口啊 ,也希望这个 Coder 可以取得更多的成绩啊 , 欢迎改天再有机会 , 我们比如说半年后一年后可以再来复盘 , 再来聊一次 。
好的 , 谢谢叔同 。
感谢 。
如果你认为有朋友也会喜欢本期十字路口的内容 , 请转发微信推荐给他们 。 最后欢迎你加入十字路口的会员群 , 我们鼓励大家在群里聊天互动交朋友 , 寻找未来的同路人。






