「1 亿 TOKEN 俱乐部」挤爆了，AI 的燃料不够了｜对谈于文渊：阿里云百炼技术负责人

快问快答0:00

欢迎收听《十字路口》，我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。《十字路口》是乔布斯对苹果公司的一个比喻，形容它站在科技与人文的十字路口，伟大的产品往往诞生在这里。

我们长期观察 AI 创业，如果你正在做一件让你自己感到兴奋的事情，哪怕它还只是一个想法，我们都很愿意听你聊一聊。

我会认真看每一条留言

。

Koji 杨远骋0:32

嗨，我是 Koji。那伴随着 Claude Code 和 OpenClaw 最近的爆炸性流行，我们看到全世界好像都在惊叹：哇，Token 不够用了！

这个 Token 不够用，它只是一个结果；不够用的还是更高性价比的算力。未来我们能不能像用水电煤一样稳定地用 AI？

会决定最后人类智能的上限。那阿里云、百炼呢，也是中国最大的 MaaS 服务商之一。因此我们今天就请到了文渊，阿里云、百炼的研发负责人。

你好，文渊，欢迎来到《十字路口》，和大家打个招呼。

于文渊1:05

嗨，我是文渊，我来自阿里云、百炼，非常感谢 Koji 的邀请。

Token核弹1:09

Koji 杨远骋1:10

好，那我们还是从快问快答开始，我们的一个老传统：让大家了解你。请问文渊你的年龄？

于文渊1:16

我今年 39 岁。

Koji 杨远骋1:17

然后你毕业的院校？

于文渊1:19

我本科毕业于北京大学，博士毕业于英国的爱丁堡大学。

Koji 杨远骋1:23

MBTI 和星座？

于文渊1:25

我是 INTP，双鱼座。

Koji 杨远骋1:28

文渊在负责百炼之前在做什么？

于文渊1:30

2018 年我做了一个小公司，被收购进了阿里，当时是在做图计算，后面一直都是在达摩院和通义实验室做一些系统方向的研究。

Koji 杨远骋1:41

最近两个月，我们看到 Claude Code 和 OpenClaw 席卷全球，这个对你们的工作带来了哪些影响？

于文渊1:48

就是 Token 数的迅速增长，基本上按月要翻倍的一个速度在增长，而且都是非常非常高质量的 Token，都是非常非常 SOTA 的 tooling 模型的增长。

大家已经不再把 AI 当作一个 chatbot 或者是闲聊场景，大家把它融入到生产力的场景，这是非常非常夸张的 Token 的消耗。

然后现在仅仅是一个开始，我们相信这个增速会迅速迅速地达到一个非常夸张的程度。

Koji 杨远骋2:18

现在仅仅是一个开始？

于文渊2:20

真的是一个开始。

Koji 杨远骋2:21

一方面是 Claude Code，一方面是 OpenClaw，就是让 Token 燃烧突然，这个核弹级的爆发，然后全球都在缺算力。背后的原因有别的吗？

于文渊2:31

今天其实 AI 在非常深刻地改变大家在怎么去使用算力。我非常非常难预测短期内下一个爆发的这种场景是什么。

我非常笃定地可以说，比如说三五年，有非常非常多的人力所花的解决的事情，都一定是会用 AI 来完成。

第二个就是云计算，今天云计算的数据中心长什么样子，调度系统长什么样子，大家在用怎么去消耗云，是计算存储网络怎么去用，基本上三五年后会和今天完全完全不一样。

Koji 杨远骋3:13

所以你觉得云计算的范式也会发生天翻地覆的变化？

于文渊3:16

会发生天翻地覆。

Koji 杨远骋3:17

云梦会重新洗牌吗？

于文渊3:19

已经又再有一些洗牌的这个趋势了。什么叫做一个好用的云，其实在今天也在变化。为什么会有蓬勃而出的新云？

那未来的云是什么样子？我们的现在是发展在一个十字路口的位置。

Koji 杨远骋3:35

因为其实有很长一段时间，大家会认为这个全世界的云厂商的格局几乎就定了嘛，就那么几个中国的巨头、美国的巨头定下来了。

但是最近我们这些 Neocloud 的出现，你会认为这个是一个昙花一现，最终还是云巨头会就拿下这个战场，还是这些新的创业公司，或者就是他们也不能那么创业了吧，Cloudflare 还是有规模了，就这些新的公司里面，他们有机会跻身到一线的巨头的行列吗？

于文渊4:03

这个我很难判断，但我觉得因为每个云厂商自己也会在变革，革命自己。阿里云是中国最大的一个云计算的厂商，我们这个云的用户是不是未来都不是真人，是 Agent？Agent 用云他们需要什么样的计算存储网络，什么样的数据库，什么样的算力，怎么样去满足。

GPU不闲4:15

于文渊4:24

所有的厂商都在迎接变革。

Koji 杨远骋4:28

阿里云全世界非常重要的云厂商之一，你最关注的事情有哪些？

于文渊4:33

我们第一关注的肯定还是稳定性、安全，当然也是非常重要。但是我这里做的变化就是，白天级别我们就能看到用户量的巨大的增长，Token 量的巨大增长，算力需求的巨大增长。

我们千问 3.5 除夕当天发布，两个多星期的时间，它的峰值 Token per minute 已经跃升到我们历史上所有的文本模型没有见到的高度。

我们有一个最激进的对算力投入的 CEO，依然我觉得还是不够用，因为我们还有很大的模型研发，我们还有很多的这个客户的服务，我们 Token 数增长还依然是不够用。

Koji 杨远骋5:12

这个爆炸性的增长，它是在一个什么样的时间节点开始的？

于文渊5:17

我感觉就没有停下来过，从百炼的上线的第一天。

Koji 杨远骋5:21

所以你没有觉得这个 OpenClaw 或 Claude Code 有加速这样的增长吗？

于文渊5:25

有加速这个增长，那是在 Agent 场景下是绝对的加速。但是在我们历史的看来，我们有很多很多个，比如说视频的生成模型，一个模型跨过一个门槛，它从 demo 到真实市场可用，迅速地带来一波一波这样的增长。

Koji 杨远骋5:45

那在这样剧烈的变化里面，要去追求稳定，是不是很难？

于文渊5:51

很难，对。我们在稳定的前提，我们也非常希望说我们把算力很好地利用起来。除了安全稳定性这个以外，这个面对这么快速的增长，我们还有一个巨大的限制，限制就是 GPU 的供给是非常有限的。

很多的算法团队都在抢说我需要这个 GPU 来做训练，我希望这个场景用更强的模型，我需要有更好的服务质量。

那么在这中间有非常非常大的系统和工程的挑战，我们有一个非常非常重要的使命，就是让每一个 GPU 不要有一秒钟闲下来，让它发挥最大的作用，一千卡、一万卡、十万卡、一百万卡。

希望把阿里云的所有的 GPU 的算力资源，让我们的所有的用户都能享受到极致的弹性、极致的稳定性。他们看起来都是有一个中国最大的算力集群，可以用一个 API 调用就可以使用好。

Koji 杨远骋6:50

最近我们还看到有一个微信群，叫做这个 " 一亿 Token 俱乐部 "，就是你要一天烧掉一亿 Token 才有资格进这个微信群。在前采的时候其实你有提到说关注数量没有那么重要，应该同时也关注质量，这个可不可以也展开讲一讲？

于文渊7:07

其实 Token 有一点点误导性，像一个 0.6B 的小模型，或者 embedding 的小模型的一个 Token 和一个会深度思考的大模型，今天 SOTA 的模型，它的 Token 其实是不管从算力、智能和水平上都是不等价的。OpenClaw 的这波，然后其实这个大家会发现，每次大家用的都是非常 SOTA 的开源模型或者是闭源模型。

Koji 杨远骋7:33

在百炼你们看到每天烧掉一亿 Token 的这个用户大概有多少人？

于文渊7:38

我们感觉现在每天都在增加，数以万计的人每天都在增加。所以你们的这个一亿 Token 俱乐部可能

门槛要再提高一点了。

Koji 杨远骋7:50

变成十亿 Token 俱乐部？

于文渊7:51

对，我觉得十亿 Token 俱乐部，因为我们的这个 coding plan 的用户，就是重度的个人在消耗 Token，一亿已经不是一个很大的门槛。

Koji 杨远骋7:59

那除了 Token 你们还关心些什么？

于文渊8:02

我们关心峰值是一个什么样的调用量，我怎么样去做技术上的削峰填补，怎么去做好的调度，把 GPU 充分地利用起来。

我们也希望有更多的用户进来，然后有更好的服务质量，包括首包延时和生成速度。

Koji 杨远骋8:19

但我在想，让 GPU 物尽其用，是不是还有一个点，就是说让它 24 小时都跑，因此做国际化，就可能中国的白天中国人用，对吧？

然后欧洲的白天欧洲人用，所以这个会有这样的考虑吗？

于文渊8:31

对，这个 Token 出海其实一定是一个我觉得非常非常重要的事情。所以这里面我们也才刚刚起步吧，就是对于阿里云来说，我们非常拥抱国际化，我们希望做好国际化，但是国内和国际的业务的发展不在同样的一个速度。

因为可能如果稍微慢两个月，你会发现哇，你这个才是在只占百分之个位数，这个相比我大盘。

但是这两个速度其实今天非常非常难去齐头并进，但我很相信最终的终台一定是国际国内都要用。

当然这里面有非常多的问题需要克服，地缘政治的问题啊，这个合规的问题啊等等，但从整体来说，今天的阿里云中国厂商的 AI 出海，我觉得是一个非常大之所趋且停不下来的一个方向。

Koji 杨远骋9:20

其实在百炼，我感觉你们是不是可以开一种上帝视角呀，就是你能看到今天比如说什么赛道、什么领域、什么场景用的 Token 是最多的，这里有没有一些你观察到的也可以分享的故事，比如说一个人他在什么场景下用了大量的 Token 去干一个什么样的事情？

于文渊9:38

某个北岭的这个厂商，他在经销商群里可能会建一些机器人，经销商说补货，就直接对那个机器人说什么什么，多少多少箱，这里要深入地理解到这里面是什么饮料，他以前买的啥，什么水饮，直接就给他去补货了，就是用非常自然语言的方式在一个群里。

Koji 杨远骋9:57

其实听起来这个好像也是更自然的，不用再去学一个什么系统，我就像和一个真的人在说话一样，说我的需求嘛。

所以会不会这就是一个这个更自然而然的未来？

于文渊10:09

对，这个肯定是一个自然而然的未来。因为这个当大模型其实它真的是去替代一个人，未来整个的行业很多的角色都可能会深远地被大模型去影响。

Koji 杨远骋10:20

今天所有的这个云服务厂商都推出了自己的 MaaS 服务，然后在外界看来好像大家都长得差不多，但是我相信可能还是从内行来看有差异化。

可不可以请你给我们讲一讲，就是大家的差异化会主要体现在哪些方面，然后这里面会不会有一个你认为的，比如说制胜的差异点？

于文渊10:42

我其实是一个比较 hands-on 的，就是 hands dirty club，我还是希望能把 hands 搞 dirty 的一个工程师。一个公司它的基础设施做得好不好，技术做得好不好，其实很影响这个我们做的这个产品好不好。

阿里云本身是有在国内做 infra 做得非常久，积累很多，不管是产品线的广泛，还有一个规模，还有这个技术的厚度。

与此同时呢，我们还有一个通义实验室的兄弟伙伴呢，给我们提供好的模型，这个模型不是一个黑盒的模型，是背靠背的一起在做。

模型的上线前不停地在摸，我们也有一个好的芯片团队，这个平头哥。我在内部从 CPU 时代开始，其实用了很多的平头哥的芯片，我觉得开发体验也非常非常的好，效率也非常非常的好。

所以这是一个很独特的感觉，从我们提供的模型，我使用的 infra，我们的算力的资源的规模和我们自研的这套东西是可以端到端做大模的。

Koji 杨远骋11:40

所以具体讲一讲，比如说在百炼去调千问模型和我在别的平台去调千问模型，有没有哪些独特的优势吗？

于文渊11:48

客户反馈我还是听到非常多的，就是说为什么我部署的千问模型的效果或者质量或者速度没有百炼上的好。

自建vs云11:49

于文渊11:59

当然这个不只是千问模型，其实包括开源模型，因为我们这么多年是积累了比较多的精度体系、稳定性体系的一套的这个推理的服务的框架。

我们可以比较自信地说，千问所有的模型的 model card 上的所有的分数，在百炼的 API 一定可以做到。

Koji 杨远骋12:21

其实今天也会有一些企业，尤其做到一定规模之后，他会觉得私有化部署就自建是成本更低。那有没有任何一个情况，你觉得企业还是应该考虑自建？

于文渊12:34

好问题，你把我问倒了。我想想，我发表一个 " 暴论 "，我不代表阿里云，我只代表阿里云百炼，我认为没有任何一个情况需要自建，真实的是这样子。

Koji 杨远骋12:46

这是不是也符合现在社会的发展规律，就是大家的分工越来越精细化，专业的人去做专业的事情？

于文渊12:52

一方面我觉得肯定是这样，另一方面我觉得是大家低估了这个东西的复杂性和增长速度。客户他可能会自己采购一些 GPU，我觉得无非就三个原因。

第一个原因他觉得这个成本可控，就不管我用什么，我就这么多 GPU 了，我完全知道我未来几个月这些的成本花了多少钱，然后我自己做好优化，这个成本很可控。

第二个可能是安全，模型是我自己的，数据是我自己的，什么请求是我自己的，不要被别人看到，所以 API 不太放心。

第三个可能大家还觉得这个 GPU 买来是很灵活的，我可以部署各种各样的模型，我的业务不管怎么调整，我只要是英伟达的卡，我可能什么都能干，对吧？

但我其实有一个 " 暴论 "，就是这个恰恰相反，你这如果是抱着这个目的来说，也许用 MaaS 才是能解决你这三个 concern 的最好的一件事情。

Koji 杨远骋13:44

就成本可控，然后安全和灵活，就反而你觉得 MaaS 是可以更好地比自建满足这三个需求。

于文渊13:51

首先第一点呢，就是这个成本本身，如果大家折到某一个模型的 per Token 成本的话，它要解决几个问题。

第一个就是在效果满足的情况下做推理优化，其实这个模型的变化也很快，算法迭代也很快，我每个公司有一个 infra 的工程师去保证它的这个 Token 的推理优化是很难的。

第二个这个业务场景，你是自己的 GPU，你能不能把它们都用好，模型越来越多，服务质量和这个成本如何去平衡，都是非常非常复杂的系统问题，其实是很难解决的。

第二个从安全上来说，其实从作为一个云厂商，我们是绝对的可信，这是一个云厂商的一个操守，我们是看不到也不会看用户的数据的。

我们其实在推一种叫做机密推理的方式，我们看不到你的模型文件，看不到你所有的请求，端到端的密钥在你手里，这个真的就是密码学的保障。

编程反思14:40

于文渊14:50

第三个我觉得从灵活性上，这个 MaaS 更灵活，因为我们可以知道这个今天最大的确定性其实是不确定，明天的 AI 需要什么，明天的模型长什么样子，架构会有什么的变化，然后推理效率会变成什么样子。

Koji 杨远骋15:11

这里有一个插播的问题，你本科是计算机专业的对吧？

于文渊15:14

是的。

Koji 杨远骋15:15

今天你的这个在计算机专业的学弟学妹们，然后首先你还建议大家去学计算机吗？在本科，然后如果还建议的话，你认为大家学习的方式方法会和当时你自己的那个年代有哪些不同？

于文渊15:29

我的建议是大家继续可以学计算机，实验室的老师，80 年代就是北大的计算机的本科生，他说他的老师跟他说，未来人有两种人，一种是被计算机使用的人，一种是使用计算机的人。

Koji 杨远骋15:43

准确呀，对，写完整那篇文章混在系统里的人。

于文渊15:48

对对对，就是要么被计算机使用，要么你去使用计算机，这个时候 80 年代是一个 truth，然后在 20 零几年，我是零几年读大学，所以也是一个 truth，我觉得今天还是一个 truth。

今天计算机专业的同学，不管未来 AI 可以解决什么问题，它实现的还是这件事，就是这个物理世界的这些到底逻辑的电路门、硅片上的设计或者生产，这里面 AI 或者自动化会发生越来越大的作用，但是我们不能不知道中间是如何发生的。

第二件事就是我觉得如果学弟学妹们怎么去用 AI，我的建议学弟学妹们一定不要用 AI 帮你写太多的代码，这个是我觉得可能有点反直觉的。

因为我其实前两天看到了一个张文宏的访谈，这个说医生到底应该怎么用 AI，他就说的一件事是，如果已经非常资深的医生用 AI 是肯定可以的。

如果一个实习医生从建第一个病号开始，就直接丢过去给 AI，AI 告诉结果就看，他就会找不到 AI 的问题，他没有这个经验的 build up，没有这个好和坏正确与否的判断，他只能相信 AI 可能能做 99% 的正确性，那 1% 这个人是找不到其中的问题的。

刚刚迈出行的计算机专业的同学一定要避免自己成为那 99% 和 AI 高度重合，没有真正技能 difference 的一定要还要成为能识别出 AI 做不到那 1% 的那件事情的人。

Koji 杨远骋17:33

这个确实还是挺有趣的，科策君发一个数据说，他们可能半年前去用 type type type 补全代码的人，就是无脑补全代码的人可能只有 2% 30%，但是最近这个已经完全反过来了，就是说用无脑补全代码的人已经变成了 7% 80% 了，就这个趋势好像不可逆转。

那比如说你能想到一个具体的例子是说，什么时候因为曾经手错代码，因此形成了自己的一些判断和审美，所以在遇到一个 AI 去解决某个问题的时候，你产生了不同的看法和见解，然后给他提了不同的建议吗？

于文渊18:07

对，这个其实

我们日常非常多，就是我大家做 code review 的时候，如果一看这是 AI 生成的代码，至少我做 code review 的时候会很慌。

日常中我们做的工作把这种 AI 的代码交进来又砍掉的 case 太多太多了。大家的 Vibe Coding 在生产 series 用中还是我感觉还是差这么一点点，就是当你真正的压力一上，你会发现暴露问题，做一个 prototype，这个 Vibe Coding 今天的质量已经到那个点了，我觉得完全没有问题。

生产可用的代码，你需要知道每一行它可以完成你想要的事情，同时它的副作用是你可接受的，不会产生内存泄漏，不会占用更多的什么文件去饼。

大家做 AI 应该知道它的上下文，它对这个事情的深度理解程度远远远远没有做到那里。所以我觉得 mission critical 的代码暂时 AI 还是不行，但它一定能作为你的效率工具，你不要说认为它全不行，但这个 judgment 特别特别的重要。

因为所有东西进去之后再去产量，那永远是一个非常 costly 的事情，它也不是一个效率工具了，它会让你成为一个石山中无法维护的代码中去做这个事情。在苦海中挣扎的。

对对对，相反我觉得这个 Spec Coding 就是是我们认为比较好的一个方式，你需要写非常清晰的需求文档或者是规范，这个对架构师的要求非常非常的高，讲得很清楚。

这个去年的 FAST 有一篇很好的论文，一个顶级的存储的的顶会，它让 AI 写这个文件系统，它把各种的 Spec 就是来清晰地给 AI，然后发现 32B 当时的模型如果 Spec 写得够清楚，它都可以把文件系统这种底层的高质量的东西写好。

这个我觉得启发还是很大的，如果人是能把用一个偏形式化的逻辑中把我想要的东西能描述清楚，AI 是肯定是把填空的事情做得很好。

但我今天我不敢说我用两三个提示词，它就能把这件事做好。所以说我还是非常鼓励大家可以多尝试 AI，但是前提是首先自己能完成这个工作，才让 AI 去替代自己。

Koji 杨远骋20:21

因为现在有些企业他们还在很激进地讲说，我们一定要把这个 AI 生成的代码提高到一定的比例，这当做一个目标去提，所以这个在你看来这是有点危险的一种提法吗？

于文渊20:34

我觉得是很危险的一种提法，对，因为大家如果但凡对今天的 AI 它的算法能力的限制有所了解的话，这个都是非常危险的提法。

我们日常人和人之间的合作交流中有很多的知识的传递，是一些非常隐式的，是非常过程性的，就是你没有办法非常明确的直接的靠几句提示词就能讲清楚。

很多的地方是可以这么做，可以那么做，没有那么的绝对，但是它应该怎么做，可能和这家公司创始人风格是什么样子，这个产品本身的一些上下文历史很有关系，这些东西其实 AI 是 get 不到的。

Koji 杨远骋21:13

不要低估 AI 的能力，也不要高估 AI 的能力。

于文渊21:15

绝对不要高估 AI 的能力，但我相信 AI 应该是个效率工具。今天我觉得更应该讲的是，人家一个 AI 可以完成它自己原来需要几个这样的工程师所要完成的事情，但不能是一个 AI 替掉几个工程师。

Koji 杨远骋21:28

就是我最近在想一个事情，就是说这个过程知识是很重要的，就是说我觉得我们把一个东西做出来要三个要素，第一个要素生产要素，第二个是知识要素，第三个是过程要素。

就比如说我们都在宜家买过家具，对吧？那其实我们买来生产要素，也买来了那个说明书，那就是知识要素，但是每次组装仍然很痛苦，就是这个过程，但你就发现找个师傅上门，他哐哐哐就装好了，但其实他拥有的东西和你是一样的，但是他因为装过很多遍，他是过程熟练。

反直觉预言21:40

于文渊21:56

对对对，所以我个人感觉程序员其实非常重要的一点是一定要把自己的能力点立在 AI 做不到的那个点上，如果它一定将来永远永远到了 99.9%，自己那 0.1% 还是要坚守住

，没有办法。我觉得大家会发现这个 AI 事情都会很反直觉。我看到 AI 写文件系统那个事情，其实我的一个更好的直觉是，AI 可能真的能替代的那些人也许是写最好的那些，就是比如说写操作系统内核，写数据库内核，写文件系统，这些可能是最容易被打拼一样的提效和替代。

Koji 杨远骋22:35

这个和很多人的想法可能是恰恰相反的。

于文渊22:40

就是我觉得像前端工程师或者说和产品中，它的这个很多的逻辑不是 copy 或者什么，它需要的是有一个 know-how，说我需要让怎么让用户去把它用起来。

Koji 杨远骋22:50

明白，就是和人走得越近的东西有可能越难被取代，但是系统工程师写文件系统、写操作系统，因为它是想办法要去物尽系统启用，所以它反而更容易被取代。

于文渊23:03

对，它越更容易被取代，而且它的代码库质量很高，这个测试用例非常的清楚，结果非常清楚，比如说我就要优化百分之多少，对吧？

就是我就像是一个非常精准的数学的形式化的问题，像 AI 今天我们说数学竞赛做得非常好，编程竞赛做得非常好，就是因为这个问题都足够的清晰可以定义它的结果。

那我什么样叫做好的短视频 APP，什么叫好，这是没有什么清晰定义的。

算力石油23:29

Koji 杨远骋23:32

这是一个开放问题。

于文渊23:33

非常开放。

Koji 杨远骋23:34

那你觉得 MaaS 系统工程师是一个开放问题还是一个封闭问题？

于文渊23:38

我其实觉得是一个开放问题。在今天因为 AI 的变化太快了，我不知道明天是什么。在这种情况下，我的底层资源变化也很快，我的算力的情况也变化很快。在变化非常快的情况下，它需要的是一个人的潜力，它不是说一个人的知识，就是它的应对变化的能力。

Koji 杨远骋24:00

我们其实今天在讲到这个中国的 AI 的时候，都会面临一个英伟达的供应或者断供，那在你看来这个对我们的影响有多大呀？

于文渊24:09

我觉得影响很大，就非常非常大。今天我对国产算力或者说这个是非常非常有信心的，对吧？

就是它一定能非常好，但算力这个东西在今天的这个市场上，它有点像石油，它本质上不是说中国能不能产石油的问题，或者说中国有多少个油田的问题，是中国每天需要的石油和每天能供给的石油是不是匹配的问题。

今天其实我完全的相信中国能做自主，能做自主可控，我们自己有非常聪明的工程师和工业基础，大家一定能把这个技术占上什么的，就成为世界第一，这个是我完全完全有信心的。

但是今天这个油田在没开采的情况下，已经有非常多的下游的需求的时候。

Koji 杨远骋24:58

就高速公路上的车已经跑起来了，油还不够。

于文渊25:00

对，算力如果供给会产生缺口，其实是很影响中国的 AI 的发展，这个很多国家一样，但是大家可能卡在了电力上，电力是工业的血液，可能就一百年前就知道了，但是不知道为什么今天现在供血不足了，对吧？

如果让我真实的讲，个人感觉还是需要有更多的，只要是能进来的这个算力供给，对中国一定是只有好处没有坏处的。

Koji 杨远骋25:24

那像国产的芯片，我知道平头哥，然后还有一些这个刚上市的芯片公司们，就是你觉得有哪些做的比较好呀？

于文渊25:33

平头哥做的非常好，今天非常非常好，就是我真的是不能再说更好。英伟达我觉得大家都是事事标准，最早开始做，没有 AI 的时候就开始做，大家就已经认为它很好，然后有非常强的软件团队，硬件团队，设计，而且很多的东西都落地了，做的非常好。

平头哥我个人感觉我们的这个团队还是非常 vegan 的人，我们用的最丝滑，最好用。

Koji 杨远骋25:57

那比如说现在在资本市场上炒的非常热的华尔县城、木犀，他们怎么样啊？

于文渊26:03

我个人是没有用过的，但是今天还是这句话，我觉得我们 MaaS 或者算力 AI 的发展，不取决于到底我做的算力产品或者什么东西做的好不好，就是我这个石油是轻质石油特别好炼，那个是重质石油特别难炼，总有人炼，但今天是总量的供给的问题。

你说我明年能增长 10 倍，我为什么不能有 100 倍的算力呢？我 100 倍的算力，我一定可以让这个市场把它消耗掉。

今天我在 1000 倍的，我相信啊，一定可以让市场，不管是做训练出更牛的模型，还是这个让更多的 AI 应用变得便宜，我相信只要给我算力，我一定让大家都用起来。

所以我永远觉得不够用，当然大家可能认为中国算力，包括阿里云的算力很够了，还是不够，对，可以更多。

Koji 杨远骋26:54

就这种感觉在云计算的年代是从来没有过的，对吧？就从来没觉得你给我更多的云，我也能把它物尽其用的。

于文渊27:02

大家其实没有这么爆炸过的对算力的需求，历史上阿里云曾经有增高速增长的时候，但我们就按照算力本身来说，这个对算力的饥渴其实是一个前所未有的状态。

Koji 杨远骋27:18

然后我们来预测一下，到 2026 年底，你估计会有哪些场景会烧掉特别多的 Token，而且这些场景可能是今年冒出来的新场景，或者大家意想不到的场景。

于文渊27:31

现在我的这个意想不到的阈值已经非常非常的高了，我觉得现在没有什么 AI 做到的事情是我今天觉得意想不到的。Agent 一定是今年的一个最大的增量的其中之一，AI 生成一定是增长之一。

对，他们到底谁多谁少，我不敢说，每个厂商可能也不一样，但是我相信这两个一定会是今年最大的。

Koji 杨远骋27:58

大家今天可以选择不通过你们去调 API，我可以直接调 OpenAI 的 API，我也可以直接调 Qwen 的 API，就你们在中间你觉得提供的这个价值，它的厚度有多厚啊？

于文渊28:11

首先 Qwen 的 API 就是百炼的 API，我觉得这个中间的厚度，就是我说的，谁能做到好的体验、低的成本和好的模型效果，对吧？

还有容量，没有一个 GPU 一秒钟闲下来，我这些容量怎么样把它转成 Token，理解今天的 MaaS 真正的算力转换成 Token，谁能转得更高效，谁有更多的算力的问题。

Koji 杨远骋28:36

现在在百炼上面可以用 Qwen 之外的其他的模型吗？

于文渊28:41

当然可以，就是百炼像作为一个云的平台，我们服务的是客户的需求，中国的这些开源模型，我们在百炼都有托管化的部署。

除此以外呢，其实国内这些模型厂商的原厂的模型，像 Mini、MiniMax、Kimi 和硅基流动的 DeepSeek 的 API，用户其实可以用百炼的 API 可以去享受这些模型，甚至推理厂商的模型服务。

Koji 杨远骋29:09

我们前面聊到 Neocloud 嘛，对吧？这些新的 Neocloud 里面有你自己特别看好的吗？

于文渊29:15

Neocloud 其实是很泛的一些 Cloud 的这个简称，大家无非还是想把一些复杂性给客户一个屏蔽。我个人感觉可能我并不是特别的看好一些，就是直接做资源转售类的这种的所谓的 Neocloud，就是把英伟达的算力或者类似的算力，就是非常相对比较裸低层的往上上的这些 Neocloud。

未来基础设施29:39

于文渊29:40

但我相对来说更看好今天 AI 原生的，就是我把硬件和复杂性屏蔽掉的，就是像 Firefox、Together 这种做 MaaS 的，然后像这个还有一些其他的厂商，就是做沙箱托管，是今天云桌面浏览器的搜索的等等等等一大堆，围绕着 AI Agent，包括可观测性，怎么样去观测 Agent，就像 Datadog 这样的公司，其实围绕着 Agent 和 AI 云相关的旗舰的公司或者产品会非常有意思。

Koji 杨远骋30:12

那我们最后一个问题就是，今天仍然感觉 MaaS 是处在激战区，因为外界环境变化非常快，一日千里，那你有没有想过哪一天如果这个战局确定下来，它是因为发生了一些什么样的变化？

于文渊30:28

这件事情其本质上取决于 AI 到底在我们整个这个未来的一个社会中去承担一个什么样的角色。我相信它会是一个类似水电煤一样的一个

utility，就跟我们手机运营商、电信运营商、交通设施、高速公路一样，它一定是一个基础设施级的 utility。AI 的终局可能确实不是一个模型，就电我不分核电水电，我插在插头上就是 220 伏交流电，一定是非常多样性、复杂性，各种各样的，包括速度、速率啊、模型效果啊，一看功能的一个非常复杂，可能没有那么垄断。

Koji 杨远骋31:13

你会不会觉得未来我们的基础设施会从水电煤变成水电煤膜？

于文渊31:20

一定的，一定是这样子，它会深远的影响我们的日常的生活，水电煤膜。

Koji 杨远骋31:27

好，那今天非常开心请到文渊来和我们录这一期播客。

于文渊31:31

谢谢 Koji。

Koji 杨远骋31:32

我们在一个变化非常快的时代，也感觉这个很期待，如果再过半年，再过一年，我们再见面再聊的时候，又会有哪些新的变化对我们产生的工作生活方方面面的影响。

于文渊31:44

好好，谢谢，谢谢 Koji。

Koji 杨远骋31:45

好的好的，谢谢谢谢，好，拜拜。

于文渊31:47

拜拜，谢谢大家。