十字十字路口Crossing2025年9月14日· 1:19:19

“语言模型撞墙了,3D大模型刚开始”|和VAST创始人宋亚宸聊3D大模型创业“狂飙”的两年

本期嘉宾是3D大模型公司VAST创始人宋亚宸(Simon),他提出大语言模型已“撞墙”,而3D大模型正处在蓝海阶段。他解释为何VAST既要研发底层的Tripo 3.0模型,又要亲自下场做应用Tripo Studio——因为知道下一版模型的迭代方向,补墙才有意义。Simon还分享了他对媒介史的独特理解:文字、图片、视频并非升维,而是技术受限下的降维与压缩,AI的终极目标是“解压缩”回3D源文件世界。他坚信未来每个人都能零门槛创作3D内容,催生一个远超现有社交平台总和的UGC生态。

  1. 0:00开场
  2. 1:05快问快答
  3. 2:38我是
  4. 8:43起源
  5. 26:14模型与工作台
  6. 28:44语言撞墙
  7. 57:26解压缩
  8. 1:12:21第四产业

转录文稿

开场0:00

Koji 杨远骋0:03

欢迎收听 《 十字路口 》, 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会 。 十字路口是乔布斯对苹果公司的一个比喻 , 形容它站在科技与人文的十字路口 , 伟大的产品往往诞生在这里 。AI 正在给各行各业带来改变 , 我们寻找 、 访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者 , 和他们一起探索 、 拥抱新变化 、 新的可能性

我是 《 十字路口 》 的 Koji, 联合创办了街旁 、 新世相和躺岛 , 发起了 AI Hacker House 这个新一代 AI 创业者的社群空间 。

我相信科技 , 尤其是 AI,是我们这一代人最大的价值创造机遇 。 欢迎大家找我聊天 , 碰撞想法 , 链接下一个可能性 。

Ronghui0:53

我是 《 十字路口 》 的 Ronghui,在美元 VC 工作过 ,也做过 5 年的硅谷驻站记者 , 关注科技发展和商业故事 。 也欢迎大家找我聊天 , 和我交流 。

快问快答1:05

Ronghui1:05

大家好 , 欢迎来到这一期的 《 十字路口 》。 本期我们的嘉宾是一位年轻的创业者 、3D 大模型研发公司 VAST 的创始人宋亚宸 (Simon)。8 月底呢 ,VAST 发布了他们的最新的 3D 大模型 Tripo 3.0。

今天我们会邀请 Simon 来和我们聊一聊 3D 大模型研发的故事和他创业这两年来的一些思考 。 那我们先来进行快问快答的环节 , 请 Simon 来回答一下 : 年龄 ?

宋亚宸1:34

28。

Ronghui1:34

毕业院校 ?

宋亚宸1:35

约翰 · 霍普金斯大学的本科 。

Ronghui1:37

你的 MBTI 和星座 ?

宋亚宸1:39

我是 ESTP, 好像是双鱼座 。

Ronghui1:44

用一句话介绍现在的公司和产品 。

宋亚宸1:47

我们公司叫 VAST, 是一家做 AI 3D 大模型的公司 。 我们有一个产品叫做 Tripo, 能力也非常简单 , 就可以用文字或者图片 、 或者多图等等多模态的方式进行输入 , 它能给你输出一个你想要的完整的 3D 内容 。

Ronghui2:06

融资情况 ?

宋亚宸2:07

融资情况 , 之前融了 3 轮 , 然后每一轮大概都在几千万美金左右 。

Ronghui2:13

目前的收入和利润 ?

宋亚宸2:14

哇 , 这个非常的 sharp,不知道让不让说 。

Ronghui2:19

团队规模 ?

宋亚宸2:19

我们加在一起有个 110 多号人吧 。

Ronghui2:23

创业之前你在做什么 ?

宋亚宸2:24

创业之前也在创业 。 哈哈哈 。 最早在商汤嘛 , 做了一段时间 AI 加动画 , 然后还有 AI 加游戏 。21 年的时候参与创立了 MiniMax,23 年的时候做了 VAST。

Ronghui2:38

然后我们有一个社交破冰的 。 用 " 我是 xxx" 来造句 , 我们在上一期里面用这个方式 , 觉得还挺好玩的 。

我是2:38

Ronghui2:46

然后也请 Simon 来今天体验一下 ,以 " 我是什么什么 " 开头 , 来介绍关于自己的 10 件事 。

宋亚宸2:52

我是宋亚宸 ,28 岁 , 是一个创业者 。 第二吧 , 我是这个 VAST 的创始人, 也是 CEO。 第三呢 , 就是我是一个 Addictive Gamer, 就是我是一个非常非常对游戏上瘾的一个人。

到什么程度 ? 在我上大学的时候 , 启蒙词上被我做出来了一个坑 , 就是我在床上面打游戏 。 第四个 , 我也是一个非常喜欢旅游的人, 去过像格鲁吉亚 、 百慕大 、 古巴 、 土耳其 、 摩洛哥 , 各种各样的地方 , 就是各大洲都去过 。

我是一个叫做跨行业者吧 , 就是我原来其实是一个偏文科多一些的 , 后面去做了 AI, 所以也有一些交叉行业的这么一个意味在里面吧 。

Koji 杨远骋3:45

我记得你是学神学 。

宋亚宸3:48

我学希伯来语 、 阿拉伯语的 , 最早是想往这个方向去发展的 。

Koji 杨远骋3:53

那你之前学的东西对现在的工作有直接或间接的帮助吗 ?

宋亚宸3:58

我觉得之所以自己做了很多决定和决策 ,其实是来自于之前接触到了什么样子的人和信息的 , 所以肯定是有帮助的 。

Koji 杨远骋4:10

5 个了 。

宋亚宸4:11

5 个了 。 我是一个特别喜欢读书的人, 当然还包括听东西 , 就是我通过读书和听东西可以学很多 。 目前还不是一个特别喜欢听播客的人。

Koji 杨远骋4:23

你最近读的一本书是什么 ?

宋亚宸4:25

最近是读了一个很薄的书啦 , 那个金剑送了我一本叫做 《 种树的人 》, 觉得我读完也挺有收获的 。

前段时间也在听这个王东院长讲那个 《 道德经 》。 我是一个特别特别在意有趣的一个人, 就是我不管在选择我们公司的候选人也好 , 还是交朋友也好 , 甚至说和投资人打交道也好 , 就是我会在意对方是不是一个有趣的人 ,他是不是有所自己热爱的东西 ,是不是两眼绽放的一点小光 。

我觉得这个对我来说是很有意义的 。

Koji 杨远骋5:04

所以你的投资人里面谁最有趣啊 ?

宋亚宸5:06

啊 , 那这这得罪太多人了 。

Koji 杨远骋5:09

有趣不有趣的 , 很多人也都不 care 自己有趣不有趣的 , 很多人就感觉我就是要严肃认真逻辑严密 , 对吧 ?

这可能是他们的职场人设 。

宋亚宸5:18

嗯 , 首先投资我们的大部分的投资人都是非常年轻的投资人, 然后年轻的投资人本身愿意投我们 , 我觉得就是一个相对有趣的决策 。

Koji 杨远骋5:27

你这端水大师 。

宋亚宸5:28

然后我是一个不擅长写字的人。

Koji 杨远骋5:33

写字是说敲字还是什么 ?

宋亚宸5:35

Every 字 , 就是跟字相关的就不是我擅长的 。 就是我英语一直不太好 , 然后在美国也待了 8 年, 所以我就慢慢的就不太擅长用文字去输出了 。

所以我学文科嘛 ,也很 suffer, 所以我一般比如说回微信消息啊 , 或者说你看我们公司从来没有我写的那种类似于公司全员邮件 , 这种全员信什么的 , 然后也从来没给什么投资人写小作文 。

就是你可以理解为跟字相关的都不是我擅长的 。 对 ,但是我擅长跟人聊天 , 就这个事情是 OK 的 。

我以前是非常坚持说 :" 哎呀 , 我这个东西我就是不行 , 所以我要克服 。" 我以前在商汤做了一段时间战略 , 那个时候就非常非常痛苦 ,因为战略你要画 PPT 嘛 , 就你得写很多这种东西 。

然后我说不行 , 我这东西差 , 我就是要补上, 我就是往死里搞 。 对 , 后来我放弃了 , 确实不擅长 。

Ronghui6:27

那你用 AI 工具写 prompt 的时候怎么办呢 ?

宋亚宸6:30

也会很痛苦 , 就不是我一个我特别喜欢交互的形态 。 但是我觉得在 3D 的时空里面 , 你可能未来不需要打字 , 你应该是言出法随的 。

因为你很难想象说 , 我在一个 3D 的时空中, 然后你突然冒出来一个键盘 , 然后你开始打字 , 这是非常突兀的事情 。

就理论上来说应该是 , 就像原神飘着一个小的 minion, 对吧 ? 然后你跟那个 minion 对话说 :" 哎呀 , 我要一个什么什么东西 。"

对吧 ? 然后他就给你实现了 , 对吧 ? 或者你有小的助手说 :" 啊 , 我要怎么怎么样 。" 然后他就给你这个实现 , 就言出法随 , 心想事成 。

理论上来说是这么一个交互形态 。 对吧 ? 它一定不是打字的 , 所以我还挺希望 3D 赶紧实现的 。

还有两个 , 我是一个特别特别喜欢内容和做内容的人。

Koji 杨远骋7:13

哦 ,OK。

宋亚宸7:14

我从小学的时候就读各种各样的玄幻小说 , 什么唐三啊 , 我是西红柿啊 , 苍天白鹤啊 , 天蚕土豆这些等等等等的 。

然后后来读各种各样的漫画 , 各种民工漫也好 , 还是一些这个所谓的硬核二次元的漫画也好 , 包括番剧 , 再包括打游戏 ,of course, 这些内容都是我最爱的 。

包括当然还有一些传统的电影啊 , 包括音乐啊 , 这些都是 。 起点小说里面就上传了我写的玄幻小说的 。

Koji 杨远骋7:47

可以搜到吗 ? 用什么名字可以搜到 ?

宋亚宸7:49

对 , 只有只有 200 个人看过 。 但是我确实是在商汤的时候做过一些动画的 IP, 做过几个百万粉丝的一些 IP 啊什么的 。

我觉得这些是挺有意思的 。 然后我是特别喜欢做内容的 , 包括在半次元做一些 KOL 啊 , 然后或者说 。

Koji 杨远骋8:07

你说你自己做 KOL?

宋亚宸8:08

啊 , 自己 , 就我自己喜欢做 IP。

Koji 杨远骋8:10

所以你的粉丝有多少 ?

宋亚宸8:12

我们叫 OC 什么东西 , 当时几万粉丝 。 我自己很想做游戏 。 小学的时候我就有一本非常破的一个本子 ,在我家现在还有呢 。

然后上面就是有好几种游戏 , 一种就是 RPG, 角色扮演的 , 然后你会有不同的等级 , 然后你有不同的装备 , 背包里有不同的东西 , 然后你有探险 , 然后每个人还会互相 ,因为很多男生嘛 , 下课了以后就会来找我玩 , 然后真的是可以就互相打什么杀什么 , 就跟 RPG 一样嘛 。

Koji 杨远骋8:41

感觉你在学校里面的地位非常高 。

宋亚宸8:43

啊不不不 , 就是你当你拥有了这个一个系统的时候 , 就当你成为了这个自己造了一个小世界的时候 , 你就成为一个这个世界里的神了嘛 , 你就有最终解释权 。

起源8:43

宋亚宸8:54

所以大家就会来充值 , 就比如说当什么香菇肥牛啊 , 或者辣条啊 , 或者什么北京烤鸭那种 5 毛钱的那个豆腐干制品啊 , 然后就会送给我 , 然后我就可以把它画得稍微强一点 , 特别逗 。

Koji 杨远骋9:07

所以这个事情对你现在做 VAST 你觉得有直接关系吗 ? 就当时的这样的快乐 , 创造一个虚拟世界的这种正反馈 。

宋亚宸9:16

我觉得有 , 我觉得我是一个特别喜欢创造和创作的人。 我会写故事啊 , 我会造一个世界啊 , 然后我也会去消费啊 , 我也喜欢消费别人的故事 。

这是我特别特别喜欢的东西 。 因为这个物理的世界其实还是有限制的嘛 , 就更大的世界其实来自于人的这个大脑的一些想象和发散 。

这个创意的部分我觉得还是一个更大的一个无限的世界 。 同时我也是个哥哥 , 对 , 我有一个亲弟弟 , 我觉得这个也是我挺重要的一个身份的吧 。

而且因为我们差很多岁嘛 , 所以我也更好地去了解到他们那一代人喜欢什么东西 。 因为我们在做的东西 , 无论如何都是下一代人的事情 。

对他来说 AI 就是非常非常正常的事情 。 我不会什么东西 , 我还是下意识的谷歌或者下意识的百度的 。

很难说 OK 了 , 我下意识的去打开 GPT 或 DeepSeek,但是我弟就是非常非常的熟 。 去搜索也好 , 去做一个项目也好 ,他是非常习惯地去用 AI,他觉得这就是一个很正常的 。

对吧 ? 他从小就来消费有 AI 参与的内容 。他接触的时代也是不一样 ,因为我小时候 , 最早的时候就是大量的文字的内容 ,因为那个时候互联网它没有那么成熟 , 它接受不了除了文字以外信息密度更高的信息载体 ,因为它的上下行啊 , 它的硬件的 process 啊 , 都是不够的 。

虽然可能 3D 是信息密度最高的 ,也是最自然的 , 把一个水平推过去 , 一个孩子会自然给你推回来 。 这是一个非常 natural 的事情 , 我们生活在一个 3D 的时空中 。

但是对于早期的互联网来说 , 它没有办法去支撑信息密度这么高的东西 , 所以它自然没办法了 。

那它就只能做一些更抽象 、 更降维的事情 , 这样子它才能够跑得通 。 所以说我们最看到最一开始 , 它就是文字的 , 所以我也是一最一开始看小说 , 那个时候拿 MP3 看小说 , 拿那个手电筒在被窝里面 , 怕老师发现 , 然后拿那个 MP3, 一个 MP3 显示 10 个字符 , 你要看一个 500 万字的小说 , 你得摁 50 万下 。

后来这个移动互联网出现初中的时候 , 我记得我那个时候装逼买了台 iPhone 4, 然后终于说 :" 哇 ,有这个图片了 ,有这些东西了 , 手机还有摄像头了 。"

哇 , 可觉得牛逼了 。 然后那个时候慢慢就开始这个有一些图片的内容的消费 。 那直到后来 , 我应该是到大学的时候吧 , 我们才开始有更多的视频内容出现了 , 我们才会有习惯的 。

后来有短视频啊什么的 , 甚至我工作了开始的时候 , 短视频才开始真正 go viral。

Koji 杨远骋11:50

你觉得除了就是有问题之后, 第一想到是用 Google 还是用 ChatGPT? 就你和你弟的区别啊 , 就除了这个之外还有哪些特别显著的区别 ?

宋亚宸11:59

你看我很习惯看公众号 ,他就是个不是很习惯看公众号的 ,他习惯去找 YouTube 啊 , 去找 B 站去找一些答案 , 对吧 ?

因为对他来说视频本身就是个信息密度更高的东西 , 它更符合他 bone with 的一个环境 。

Koji 杨远骋12:13

所以 bone with 3D 的用户你们已经看到了吗 ? 在你们的用户群里面 ?

宋亚宸12:17

对对对 ,他可能年纪更小 。 比如说我们看到我弟有他的学弟做 B 站的 up 主的 , 然后他去做的是那种非常非常怪的这种我不是很能看得懂的一些 3D 的一些作品 , 什么马桶人和监控人什么什么这些 。

但他有大概十几万 , 什么小几十万的粉丝在 B 站 ,有的时候甚至有百万的那种播放的那种视频 。

就是你都不知道谁在消费它 ,但是是 something,right? 所以我觉得不同的每一代人其实真的是不同的年龄吧 , 就不同的年龄段 ,他能够身处的这个环境 , 你不管是说文字 、 图片 、 视频 ,3D 的信息载体和内容媒介的区别 , 还是说是工业社会 、 数字化社会和智能社会的区别 , 它是实实在在的 。

可能一两年看不出来 ,但可能以十年为跨度还是挺明显的 。

Ronghui13:12

好 , 那我们来具体聊一聊你们在做的这个 3D 大模型吧 。 应该是 8 月 20 号吧 , 就是发布的这个 Tripo 3.0。其实前面也提到了 。

对这些新一代用户的关注 。 你可以说一说就是这个 Tripo 3.0 你们是给谁设计的吗 ? 然后和前面的产品相比 , 你觉得最大最重要的迭代在哪里 ?

宋亚宸13:32

其实我们 Tripo 在已经做了挺久了 ,24 年初上线到现在已经有一年半时间了 ,也有很多用户 。 现在全球范围内也有个三四百万的专业的创作者 , 包括 4 万多家企业客户 , 这里面可能有 700 多家就是非常大的大客户 。

那么大家都在这个里面其实把 AI 3D 能够去用起来 。 但是呢 , 它我觉得一直不能算非常的 pipeline ready, 或者说在实际的 3D 的管线中, 它只是在一环中产生了一定的作用 。

它可能还需要用专业的人去修改一下呀 , 对吧 , 精修一下呀 。 那么 Tripo 3.0 我觉得它的跨时代意义呢 ,其实在于说 AI 3D 它第一次达到了一个我觉得在大部分的行业和场景内可以被直接使用的这么一个状态 。

就这个事情我觉得还挺本质的 。 就比如说你现在如果买了一台 3D 打印机 ,不管是哪个品牌的 , 放到了家里面 , 比如说给孩子买的 , 你在 Tripo 上面随便生成一个 3D 的模型 , 你给他把这个模型放到这个 3D 打印机里 , 它打出来的效果其实会非常非常好 。

你不需要做什么二次操作 , 你不要去做各种的修改有的没的 , 它直接就可以去用了 。 而且生成的效果也很好 , 你根本不知道发生了什么 , 你甚至不知道这个里面有什么什么结构啊 , 什么什么格式什么的 , 都不需要知道 。

你也不需要知道怎么样去修 3D,有哪些 DCC 建模软件 , 这些都不是你要关心的事情 。

Koji 杨远骋15:13

嗯 , 从 2.0 到 3.0 你们背后是做了什么工作呀 , 让它到 3.0?

宋亚宸15:17

那工作很多 , 包括更多的数据 , 更好的算法 , 然后优化了算法模块 。 它其实本质上来说是个系统性工程 , 它可能不是说我就干了一个点 , 我把这个点给解决掉了 。

但它绝对是一个在每个环境上都变得更好 , 比如它的可控性更强了 , 成功率更高了 , 更精细了 , 然后包括它的这个性能也更优化了 。

但我觉得这个里面可能更精细了 , 尤其是它的几何更精细了 , 这一点是尤为重要的 。

Ronghui15:48

Simon 可不可以给我们的听众一些比较具象的分析 ? 就比如说 ,其实我也没有技术背景啊 ,但是就是在我们开始录之前 , 我跟那个 Gemini 一直在讨论你们的一些资料 。

然后比如说他有跟我分析说 ,其实在 Tripo 2.0 的时候 , 一些公开的信息里面提到说你们采用的是融合 DIT 和 UNET 模型的复合架构 。

就 Gemini 给我分析的是说这个复合架构本身就非常的挑战 。 我想问一下你们在 3.0 是不是还用了这个架构 ,以及如果你来解释一下 Gemini 提出的这个架构本身就是很有挑战的 , 具体体现在哪里呢 ?

宋亚宸16:25

那么 3.0 我觉得有一个 , 还是那句话 , 就是我实事求是来讲说 , 它不是一个一照天吃遍天的东西 。

不是说我说哇这个东西就 MOE 了 , 我们就牛逼了 。 我说这个东西就是我们经常在看一些这个大模型 ,不管是什么的大模型 , 大家会经常去说啊我就因为这个东西我就牛逼了 , 然后这个 title 一放哇这个可牛逼了 。

我觉得首先我觉得科学不是这么做的 , 它肯定不是说啊我就只有一个点 , 我变革性 , 它不是这么一个事情 。

那么我觉得值得一讲的是我们研发了一种新的表达形式 , 叫 SparseFlex, 我们把它叫做 SF。其实最早的时候呢 , 我们在今年的 4 月份就开源了 , 叫 Tripo SF。

它的那个效果呢 ,其实确实就是本身是比较好的 。 那么这个 SparseFlex 呢 , 它有不少特点 。 首先呢 , 它去生成一个 3D 模型的成本是大大的下降了 , 它的生成的速度大大的提升了 ,因为它跳过了这个水平性这个环节 。

同时的话呢 , 它的精细度变得更加的提升了 , 它可以支持上千乘上千乘上千的这么一个空间去生成 。

那么自然它的颗粒度 , 生成的颗粒度就可以更细 ,有更多的细节 。 你就这么理解吧 , 我觉得说了很多太复杂的话 , 我觉得这么理解 , 就是大家可能对文生视频是比较了解的 。

文生视频我们在做 DIT 的时候 ,其实很重要的是叫做 token 或者叫 tokenization, 这个 tokenization 里面的 token 是很重要的 。 那怎么去定义它 ?

那么你可以理解为 SparseFlex 就是一种 3D 的表达形式 ,而 3D 的表达形式就是一种 token。 那么越好的表达形式 , 它的压缩率 、 还原率和保真率就越好 。

那这样子的话呢 , 你能够一方面支撑更多的数据去进行训练 , 第二呢 , 它本身生成的效果就更好 , 同时它的精度更高等等的 , 它有很多特点 。

之前我们也看到说近期有很多新的表达形式被提出来 ,也是非常好的 。 比如说再早的时候可能 Mesh, 然后再比如说之前有 Nerf, 最近又很火的这个高斯 , 然后 SparseFlex 也是一种表达形式 。

这种表达形式对 AI 3D 的训练有非常好的一个效果 。

Koji 杨远骋18:47

那 3.0 发了之后有没有一些数据能够显示 , 比如说这个提升带给用户的这种价值的提高 ,不管是用量啊 , 或者用户的这个付费啊 , 或者用户的使用的更高的频率啊等等 ?

宋亚宸19:03

肯定是有 , 用户的用量有非常大的一个提升 。 对 ,3.0 的反馈还是非常好的 。 而且 3.0 现在我们发布了 , 可以理解为一半吧 , 就是现在只发布了 standard, 我们之后还会再发布一个 ultra。ultra 的那个版本生成的效果会更好 ,但它可能生成的时间会更长一些 。

Koji 杨远骋19:23

有没有什么是 2.5 不能做的 , 然后 3.0 给它解锁掉的场景 ?

宋亚宸19:28

我觉得这么理解比较好 , 就是我们其实有一个产品叫做 Tripo Studio, 然后这个 Tripo Studio 它包含了大量的 AI 算法集合 , 然后它上面有一系列的功能 。

就 Tripo Studio 的定义就是我们希望有一个 AI native 的一个 workflow, 用个 AI 原生的工作流去替代整个非常复杂的 3D 的冗余的一个传统的制作管线 。

这个事情是我们 Tripo Studio 希望去做的 。 那么 Tripo Studio 上线了以后, 收入翻了两倍多 ,其实是一个非常大的一个提升 ,在 5 月 31 号上线的 。

Koji 杨远骋20:05

我记得有一次你在十字路口线下的开放麦有分享说 , 你们其实在欧洲有一个套壳的小哥 , 就套 Tripo 3D 的 , 对吧 ,Tripo 的那个 API,他赚了很多钱 。

所以现在这个 Tripo Studio 就是类似那个小哥做的那个套壳工具吗 ?

宋亚宸20:20

不完全是 , 就是我们希望把它做得更加的 agent 化 , 我们之后会在里面加更多的一些对话框啊 , 或者包括一些简单的语言的交互和这个拖拉这样交互 。

你可以理解为我们 3D 的生成了以后的东西 , 比如说我生成了一个 80 分的东西 ,以前我们会在传统管线里面会去做二次编辑 , 现在我们在 Tripo Studio 上面做二次编辑 。

那这样子的话 ,而且这个编辑的成本和门槛和时间都会大大的下降 , 这个就是 Tripo Studio 的意义吧 。Tripo Studio 其实给我们带来了很多新的功能 ,而这些功能都是全世界独有的 。

我可以举几个例子啊 , 比如说第一就是万物的自动的语义分割 , 我们把它叫 segmentation, 就你生成一个 3D 的模型 , 你原来其实它是一坨的 , 这很好理解 。

比如说文生图 、 文生视频 , 它刚生成出来的时候都是没有源文件的 , 所以它没办法做二次编辑 。

比如说你生成一张文生图的一张图 , 你放到 Photoshop 里面 , 你发现它是不分层的 , 它没有 layers, 对吧 ? 那你没法做编辑 。

那么 3D 也是 ,以前也生成东西一坨 ,但现在我们生成出来的一个 3D 模型了以后, 它是可以自动的做成 , 通过理解这个模型是个什么东西 , 然后把它的每个部件变成一块一块的 , 然后把 。

Koji 杨远骋21:44

这是一个很大的变化 。

宋亚宸21:45

对 , 然后把每一块都自动的可以分割开来 , 然后每一个部件再自动的给它补全 。 就比如说我拿了一瓶水 , 这个水它会和我的手自动的可以分开来 , 然后这个水是一个单独的完整的一个 3D 的模型 , 我的手也是个单独的完整的 3D 模型 。

这样子的话 , 它都在资产库里面 , 你可以去做替换 。

Koji 杨远骋22:04

这是 3.0 做到的事情 。

宋亚宸22:05

这是 Tripo Studio 的一个能力 。 这就是为什么我讲 Tripo Studio, 就是 Tripo Studio 其实上线了一整套的 AI 算法 , 它定义了很多在 AI 时代的一个 3D 的编辑和交互的一个形态 。

Koji 杨远骋22:22

一个交互方式 。

宋亚宸22:23

一个方式 , 对 , 可以这么理解 。 比如说我们把这 segmentation 和 part completion, 就是一个非常经典的一个事情 。 当然我们也会有一些竞争对手之后也会有这样的功能 。

Koji 杨远骋22:35

而且这个就像 Canva 出 AI 的时候 ,他们一个非常大的卖点就是我们生成的图 , 你是可以把它分成图层一点一点去编辑的 。

现在 Level Art 也在讲这个点 。

宋亚宸22:44

这个就是一个创新吧 , 就是之前没有人能做到的 , 我们先把这个事情做到了 。 然后比如说我们还做了一个叫做万物谷歌绑定 , 什么意思呢 ?

就是你生成了一个 3D 的模型 , 它原来是不能动的 , 就跟雕塑一样 ,但现在呢 , 它自动的做谷歌绑定和 monkey, 比如说人就不说了 , 这很好做了 , 比如说猫 、 狗 、 牛 、 蛇 、 鱼 、 龙 , 甚至八爪鱼 、 什么蜘蛛 , 它都可以去做自动的谷歌绑定和动作 。

那就等于说你比如说你生成了一只龙 , 对吧 ? 龙不是 , 一条龙 , 一只龙 ,不知道怎么说 ,但你可以理解为它可以自动的把它绑到这个手指头这个级别 , 那它就可以动起来了 。

那这个就是一个非常重要的一件事情 ,而且大大的节省了创作的一个时间和降低了门槛 。 对 , 然后还做了很多啊 , 比如说 demo 的生成 , 就原来生成一个模型可能几百万面啊 , 几十万面很正常 ,但你要进入到一些比如说我们把它叫做实时渲染的管线 , 比如说游戏啊 、XR、 元宇宙啊这样子的管线 , 你就会发现说它很吃本地的性能 ,因为几十万面 、 上百万面

, 你比如说一束光打过去 , 它的计算量就很大 。 但是当你只有比如几百面 、 几千面的时候 , 那你自然的这个计算量就变小 , 然后你就没有那么吃本地的性能 , 它就可以实时的去进行渲染 。

所以呢 , 对于这样子的场景来说 , 我们就自研了一套基于这个自回归路线 , 然后做了一整套的 demo 的生成 。

你生成的模型天然就是变速很低的 , 这样子它的实用性会更强 。 对 , 就有很多这样子类似的功能 , 包括我们还做了这个 magic brush 智能笔刷 , 各种各样的吧 , 一系列的这个能力 ,其实它是我们认为说它形成了一个工作流 。

Koji 杨远骋24:34

这是一个我觉得你们做 Tripo Studio 是一个非常重要的战略上的一个决策 。 因为会有很多人可能会觉得现在应该力出一孔 , 把模型积模 , 就 all in 积模 。

但你刚才其实这个热情洋溢讲了非常多 Tripo Studio 的功能 ,但我理解这背后就是大量的产研的时间精力 , 包括你自己的投入 。

可不可以讲一讲这背后的思考 , 就是为什么要做积模的同时又做 Studio?

宋亚宸24:57

嗯 ,其实我们认为说未来每一个有专业能力的一个垂类的大人群 ,他都会拥有一个属于自己的 AI 的工作台 ,而这个 AI 的工作台它是可以承载它想要的几乎所有的创作 。

它符合几个条件 , 第一个呢 , 就是说真正的能够端到端 , 能够一站式的完成它想要的一个完整的一个内容创作的一个结果 。

第二呢 , 它的可控性要足够强 , 就是它的可编辑的这个颗粒度要足够细 , 否则呢 , 那很多专业的人或者有一定的这种对内容有要求的人 ,他的创意就很难体现 。

第三呢 , 就是我们认为说它的交互形态会发生一些本质的变化 。 去年年底其实有了第一个大概这样子的认知 , 所以我们大概做了半年时间 , 做到 5 月 31 号 , 我们才把这个 Tripo Studio 的第一版给它正式的给它做出来 。

早期肯定还是怎么说呢 ,不完美的嘛 , 它还是一个最雏形的一个状态 , 我们跟最近的一些迭代了以后, 它的效果已经越来越好 。

Koji 杨远骋26:03

所以还是觉得只做积模是不够的 ,因为也有人可能会选择说我就做积模 , 把这个做上面类似 Tripo Studio 这样的工作开放给生态的合作伙伴去做 。

宋亚宸26:14

嗯 , 很好的问题 。 我认为说是未来它应该是积模和所谓的这个 Agent, 或者你把它叫 workstation, 看你怎么定义它 , 这个东西大家都会去做的一件事情 。

模型与工作台26:14

宋亚宸26:26

就我举个例子 , 比如说 Cursor 应该会做自己的积模 , 可能会做自己的 Agent。 它不是一个房车 , 我觉得它是一个这样子 , 就是说就是你可以理解为在做大模型的时候 , 就在做底层大模型的时候 , 你在起新墙 , 你在不断的起新墙 , 然后你在做工程 ,在做产品功能的时候 , 你在互救墙 ,因为你要去解决的恰恰就是新墙的或者这个旧墙的缺陷 , 对吧 ?

就比如说我上一版的模型 , 它的这个人脸的效果不够好 , 所以如果我要我去做这么一个基于上版模型做的这个 Agent 的话 , 我最要解决的就是脸部的优化这一件事情 , 对吧 ?

所以我就会做一些交互形态 , 让你能够更好的去改变 AI 生成的这个脸部的问题 。 但是如果当一个新墙出来的时候说 OK 了 , 我解决了 100 个问题 , 顺便我解决了脸部问题 , 那这件事情可能就白做了 。

所以如果我们从在底层的角度去思考这个问题的话 , 我觉得它就是 AI 1.0 时代和 AI 2.0 时代的本质区别 。

就是 AI 1.0 时代的核心就是我们有很多非常非常天才的一些算法科学家 , 我们基于这些算法科学家的聪明才智 , 用大量手工调参的方式去训练很多小模型 , 然后我们基于每一个小模型去解决我们遇到的所有的这些场景的一些常规问题 。

这个很好理解 。 我们甚至看到过以前在计算机视觉时代 , 我们在做智慧城市的时候 , 会专门有一个小模型负责去识别垃圾到达了外面 , 去识别比如说这个监狱里面会不会有人打架 , 对吧 ?

就真的就是非常非常细节的一些问题 , 很长尾的问题 。 那 AI 2.0 时代的核心的地方就是我们通过 data driven 的方式 , 对吧 ?

就是通过这个数据驱动训练一个大模型 , 然后我们希望通过训练这个通用的大模型去泛化的解决所有的长尾问题 。

回到我们刚才谈论的问题 , 就是说做底层模型的优势就是我一下子能解决所有的长尾问题 。 那为什么会有人会在这上面做工具 , 或做 Agent, 或者做 workstation, 或者做应用 ?

其实核心的解释在于说我认为 AI 2.0 时代死了 , 所以我在做 AI 1.0 的事情 。

Koji 杨远骋28:44

你觉得 AI 2.0 死了 ?

语言撞墙28:44

宋亚宸28:45

不 , 我跟我没关系啊 ,是那些在做的人。 你仔细思考一下 ,其实就是这个逻辑 。 如果 AI 2.0 时代它在快速的发展 , 对吧 ?

就比如说 GPT-4、GPT-5、GPT-6、GPT-7、GPT-8、GPT-9, 那 Cursor 是无处遁形的 , 它没有活着的意义几乎 ,因为它每次解决了什么问题的时候 , 这个大哥都会啪啪啪不停的迭代新的 。

你可能就包括很多我们之前看到的 ComfyUI 的一些节点可能就没有用了 , 对吧 ? 我们去看到的很多要有些 Agent 去补偿它原有的问题 , 这就很多垂类的一些问题 , 它通用的都给你解掉了 。

Koji 杨远骋29:19

所以你是觉得模型撞墙了 ?

宋亚宸29:21

不是所有的模型撞墙了 , 我就看到了语言撞墙了 , 对吧 ? 所以大家才会基于语言出现了很多垂类的一些工程和产品 , 或者说看到很多 Agent 的出现 , 对吧 ?

因为它的发展速度相对来说没有这么快了 。 但在 3D 你很少能看到只做这样子的人 ,因为你只做这个东西的时候 , 你就会发现说当下一个大模型到来的时候 , 你就死给它看了 。

你理解我的意思吗 ? 就是说当一个大模型它还属于 AI 2.0 时代的时候 , 就是每三到五个月都有一个全新的大版本发布的时候 ,是很难出现一个自己没有大模型纯做应用的一家公司的 。

因为你在互救墙 , 好不容易护了半天的时候 , 它给你起了个新墙 , 你也不是很难受 , 对吧 ?

而且你护的旧墙的那些 , 护的那些工程 ,其实它新的都给你解决了 。

Koji 杨远骋30:10

对 , 这个我理解说应用公司在模型还在疯狂迭代的时候 ,不应该在这个时候去叼花嘛 ,因为你很可能模型一长给你淹没 。

但我比较想知道的就是因为从这个就是你们的角度 ,VAST 的角度 , 你们本来就是积模公司啊 , 你们其实淹没的是那些应用 , 为什么在这个时候你们自己要做应用 ?

宋亚宸30:28

因为你知道下一版的模型会往哪些地方迭代 , 所以你护的旧墙就很有意义 。 你知道哪些地方它就应该护这个旧墙 , 对吧 ?

然后你也知道哪些地方这个它可能不应该护这个旧墙 ,因为下个版本就给你解决了 。 所以这个时候就是我们最大的优势的地方 , 就是它既通过做工具或者做这些 Agent,不管你怎么定义它吧 , 离我们的用户更近 , 所以能拿到这个一线的用户反馈 , 然后你知道你的大模型该怎么迭代 , 同时你又大模型知道下一步大模型该怎么走 , 那你知道你的

产品该怎么迭代 , 它就形成了一个非常好的一个配合 。

Koji 杨远骋31:07

这个在 DeepSeek 他们坚决不做商业化的任何事情 , 哪怕人家把钱送到他门口 ,因为他觉得这个会稀释团队在追求模型智能的边界上的这个投入 , 所以一点都不要 。

然后他的用过产品也是做得很简单 , 对吧 ? 大家也能看到当时爆火之后 ,其实他也没有在维护 ,也没有调机器去服务他 2C 的产品 ,他把所有的能量 、 时间 、 精力全部拿去搞积模 。

但是我比较好奇的就是你在这个时候做的战略选择是又做积模 , 然后又做 Tripo Studio,而看上去其实你们现在的量仓应该没有梁文峰的量仓那么丰厚 。在这个时候这样的这个注意力的稀释 , 这背后的思考是什么 ?

宋亚宸31:44

反而我不觉得这是一个注意力的稀释 , 就是我觉得如果你只做大模型这件事情的话 , 它就有点像说学术圈它的自嗨该怎么走 , 然后你就怎么走 。

因为其实在一个大家都在发论文的时代 ,其实有些东西是很火的 , 你是需要有一个窗口去跟实际的用户去接触 , 让他告诉你什么东西才是大家真正需要的东西 。

就是还是那句话 , 我们做 AI 不是拿着锤子找钉子 ,其实我们这也是我们公司特别特别的地方 。 就我们公司在最早期的时候 , 上次其实分享也讲到了 , 就是我们做了一个 3D 的 TikTok, 然后我们发现 3D 的 TikTok 遇到了一个墙 , 这个墙就是缺少了一个前提条件 , 就是说我们想做一个 UGC 的生态和社区 ,但发现这个世界里面还没有 3D 的 UGC。

那为什么没有 3D 的 UGC,而只有 3D 的 PGC? 核心的点就是缺乏一个大众级别的创作工具 , 对吧 ? 就像缺乏一个文字的打字法和图片视频的手机摄像头一样 。

所以我们才去做 AI 3D 大模型这件事情 , 希望去降低用户创作的门槛和成本 。 那这就是我觉得很重要的一个初心 , 就是我们做这件事情 , 它是为了解决这个问题 , 那我们解决这个问题 , 它是有一个用户是遇到这个问题 , 所以我们才需要去做这件事情 , 去跟这些用户在一起 , 跟这些创作者在一起 , 去看看我们到底解决的怎么样 。

所以我们从第一天公司成立的时候 , 它就不是一个拿着锤子找钉子的公司 。 因为其实很多大模型公司 , 它其实是看到了很多场景 , 那每个地方都可以去敲一敲 , 它只是本身它做了一个大模型 , 那这个技术才有 , 对吧 ?

说不定有一点价值 , 那大家看看在哪些地方可以有价值 ,但是我们不是这样子 。

Koji 杨远骋33:29

所以一开始你们有那个钉子 , 就是要做一个 3D 的 UGC 的社区 ?

宋亚宸33:33

我们想做一个大众级别的创作者工具 , 让每一个人都可以零门槛 、 零成本 、 实时的去创作 3D 内容 。

Koji 杨远骋33:41

所以现在其实 Tripo Studio 也是服务这个人群的吗 ?

宋亚宸33:44

现在暂时不是 。 你可以理解为 Tripo Studio 现在目前还是服务于专业的用户 , 面向于 Pro C 或者叫做 PGC。 我们希望下一步就是逐步的去牺牲 , 当然这是两个不同的产品啊 , 我们会推出一个产品去牺牲它的创作的本身的可控性和可编辑的颗粒度 ,但给它带来的是大量的内容范式和模板 。

有了这样子的内容的范式和模板 , 那才可以让每一个人参与到创作当中 。 你现在去 , 比如说我想一个大学生或者我去用 Tripo Studio 是没有问题的 ,但是你比如说你让一个小学生或者说让我外婆去用 Tripo Studio, 难度还是比较大的 。

我希望真正的能够去实现一个零门槛 、 零成本 、 实时创作 3D 的内容的这么一件事情 。 当这件事情实现了 , 我觉得就有机会出现 UGC 群体 。

Koji 杨远骋34:38

什么原因让你认为会有一个未来是人人都要做 3D 呢 ? 就这个是不是其实也是还是蛮非共识的 ?

因为我可能就会觉得好像人家拍个照片 、 拍个视频比较自然 ,但是要去 ,因为 3D 其实是一个更高维的艺术创作 , 这好像不是一个需要每个人都去干的事情 , 或者每个人都会原生的就想干 、 会干的事情 。

宋亚宸35:01

但其实你刚刚说的那个东西其实也就只是存在了 10 年, 可能都不到 。 就你刚刚说拍个视频 、 拍个照片是一个很自然的事情 , 这个自然其实也不超过 10 年 。

你现在觉得 3D 这个市场小 , 或者说大家了解的不多 ,其实是一个非常错位的一个思考 。在短视频出来之前 , 你一年又会看几部电影 。在小红书和 Pinterest 出来之前 , 咱们一年又会逛几次画廊呢 ?

在微博 、 贴吧 、Twitter 出来之前 , 咱们一辈子也会读几本书呢 ? 但是我们回到 3D,在 3D 的 UGC 内容平台出来之前 , 我们已经看到每个人都在打游戏了 , 对吧 ?

王者荣耀在 10 年前就被发布出来了 , 那个时候发布的第一年就一亿多人,10 年后的今天依旧一亿多人 ,是什么意思 ?

就是在 13 亿的人口的国家里面 , 保持了 10 年一亿多人的产品 , 它就是一个全民级的产品 。 现在游戏全球市场大概 2600 亿美金的市场 , 它应该是出版社加上画廊加上电影的所有的市场的总和的至少两到三倍 , 我一点都没有夸张 。

那一样的道理 , 我认为说未来 3D 的 UGC 内容平台 , 它应该是 Twitter、 微博 、 小红书 、 抖音 、 快手 、TikTok、Snapchat、Instagram 所有这些乱七八糟的平台加在一起的两到三倍的总和 。

Koji 杨远骋36:29

你觉得这个平台是一个什么样的一个平台呢 ? 大家在上面消费的大概是什么样的内容呢 ? 是游戏还是像 Genie 3 的 ?

宋亚宸36:37

这就很好的问题 。 像我们在做短视频的时候 , 就是你问我说这个东西大家消费的是什么 ,是电影吗 ?

因为那个时候没有短视频的概念 , 它只有电影和视频 ,但那个时候电影等于视频 。 所以我说我们那个时候要说要做一个 UGC 的视频平台的时候 , 咱只能可能想到电影 ,是想不到任何的除了电影以外的东西了 。

那么一样的道理 , 就是在我们说做 3D 的可交互内容的平台的时候 , 确实你只能想到游戏 。 但是当我们在实打实的去看到今天 , 我们看到 B 站的 20 个 Type 的倒数第二个的二级菜单里面的第二个 , 你能找到电影 , 就是电影已经在所有的视频里面很小的一部分了 , 短剧的市场已经超过了电影了 , 对吧 ?

所以说我相信未来今天我们玩到的所有的游戏 ,不管是咸鱼之王 、 三消 、 还是原神 、 还是王者荣耀 、 还是吃鸡 , 我们玩到的所有的游戏 , 都将会是所谓的 3D 可交互内容的这个大品类下面的很小的一部分的精英的艺术 。

这是我认为未来一定会发生的事情 。

Ronghui37:48

说到这里 ,其实我也想补充一个背景问题 , 就是 Simon 你可不可以给我们的听众科普一下 ? 因为前面你也提到 3D 大模型跟常规的大语言模型处在不同的阶段 , 就是你们训练一个 3D 大模型跟一个常规的大语言模型相比的挑战在哪里 ?

比如你前面其实也提到了是 , 比如说数据的维度更高 , 数据更难 , 科普一下这个难点是什么 ?

宋亚宸38:16

我们还是拿我们把它叫做 AI 3 要素来讲吧 , 就是我们要养一匹马 , 我们有三个东西 , 第一个东西就是马要吃草 , 所以草料就是数据 ; 第二就是马要有好的驯马师 , 那么这个呢就是人才 ,其实也是算法 ; 第三呢就是那你要让马儿跑 , 你要有一个空间 , 就要有一个跑马场 , 这些就是算力 。

所以当你有数据 、 算力和好的算法或者好的科学家的时候 , 你自然能够训练出来比较好的 AI。 那么 3D 呢 , 确实在这三件事情上是和语言大模型有很大的区别的 。

第一呢就是就像我们最一开始在讨论的一样 , 互联网其实在最早期的时候 , 它只能支撑非常信息密度低的信息 , 所以我们的不管社交网络上还是各个网络上 ,其实拥有了大量的文字的内容是可供爬取的 。

但是 3D 因为互联网的成熟度还没到这一步 , 所以说呢是没有公开的大量的数据是可供爬取的 。

那这个会是一个非常天然的一个问题 , 就是你的数据哪里来 ? 我们拥有应该是目前全世界最大的一个高质量的 3D 的原生的一个数据集 , 目前大概有 4000 多万 ,4000 多万个类似于黑神话悟空里面那个猴子那个级别的 3D 的模型 , 作为我们训练的数据 , 这个是非常非常非常重要的 。

其他的看到的一些大厂或者竞争者大概是在百万级这个级别 , 我们应该是全世界唯一一个一个千万级或者数千万级的这么一个数量级的 。

Koji 杨远骋40:00

所以这个是因为什么 ? 你们有别人没有呢 ? 因为是不是有些钱别人买不到吗 ?

宋亚宸40:07

很好的问题 , 这是我们的核心机密 , 核心机密 。 所以在草药层面上来说 , 我们确实吃的比别人好 , 这个很重要 。

然后第二块呢就是我们的这个科学家 , 我们团队大概有五六十位清华的博士 , 然后他们其实是非常非常顶尖的科学家 。其实这件事情是很不容易的 , 为什么呢 ?

因为我们看到语言之前其实相对来说是个显学 , 所以有大量的一些做 NLP 的呀 , 然后大量的一些做这个 , 包括之前 OpenAI 也沉淀了很久嘛 , 去做这个大语言模型这件事情 。

做 3D 其实它是一个非常非常新的东西 ,AI 3D 很新 ,因为它是一个交叉学 , 它是 AI 和图形学的一个交叉 , 所以它没有什么老的人, 大部分的人都是新的人 ,他可能接触这个东西也就是一两年, 甚至你可以看到什么呢 ?

就是在可能两年以前 , 图形学的顶荟 CGraph, 你可以看到大量的 CV 相关的论文 , 计算机视觉相关论文 ,但今年 CV 的 , 就是 CVPR, 就是计算机视觉的顶荟 , 它的一些 best paper 已经跟 3D 相关了 。

很重要的点就是看到说 3D 它逐渐的在成为潜学 ,但这个就会导致前期的人才是非常的不足的 。 所以说在人才上面是很重要的 , 我们这几十位非常优秀的算法科学家 ,他才能够去迭代出来全世界最领先的算法 , 这是非常非常难得 , 非常非常难得 ,也非常非常珍贵的事情 。

这个东西就取决于说你做这件事情是不是足够的早 , 当你做得早 , 然后你又有一下这个决心的时候 , 你自然在这个里面可以比别人去更早的发现这些 talent, 发现这些天才 , 然后能够去投入 , 然后把大家形成团队 , 然后能够跑起来 , 这件事情是重要的 。其实数据也跟早有关系 ,但不完全是 。

第三点呢就是我们所谓的跑马场 , 这个就跟资金是比较相关 , 我们现在应该是这个赛道里面融资额最高的一家公司 , 当然也包括估值可能也算是最高的一家公司 。

所以说当你有足够多的资金储备 , 你有足够大的这个数据集 , 你有足够好的算法科学家 , 那理论上来说你就会有非常好的一个 AI 3D 大模型 ,但还要很多运气 。

刚刚说了要找绿洲嘛 , 这个事情不是商队越大越好找到绿洲的 。

Ronghui42:42

然后前面其实说到这个 Tripo Studio 的这个作用哈 ,其实这个如果说回过头去看一下过去你们做的这两年的这个路程 , 你会怎么给自己划分一些关键的节点或者说阶段 ?

然后比如说做这个 Tripo Studio 是你在什么时候 。 也有可能不只是你 ,也有可能就是也包含其他一些比较重要关键的人, 就是是你们在什么样的一个时间节点认为要做这件事情 ,而且要很快赶快做好 。

就是回过头去看你们过去这两年的一个发展过程 , 路线选择的一些关键点上 。

宋亚宸43:19

其实这件事情是这样子的 ,在过去两年我们就做了一件事情 , 就 23 年成立的公司 ,23 年到 24 年我们就做了一件事情 , 就是把技术做到了全世界最 SOTA 的水平 , 就做了这一件事情 。

对 ,其实我们也是有一些竞争对手 ,但我们看到很多竞争对手他其实会在早期的时候去做很多产品向的事情 。

我认为说在早期产品的本质它是技术 , 它不是产品 。 我不知道这件事情好不好理解 , 就我举个例子 , 比如说当你的手机摄像头你是 720P, 我是 1080P 的时候 , 你的 720P 增加各种人像啊 、 全景啊 、 红外啊什么这些功能是没有意义的 。

你最应该去 focus 的或者你的聚焦应该做一件事情就是把它尽快做到 1080P 甚至 4K,而不是说去纠结那些有的没的那些什么视觉啊 、 什么功能啊什么这些东西 。

因为增加那些东西不是产品的本质 , 产品的本质其实是技术 。在过去两年, 所以你会发现说过去两年我们公司可能在很长一段时间里连一个产品经理都没有 , 这是一个很正常的情况 。

然后我们的很大部分的代码都是我们 CTO 亲自写的 。

Koji 杨远骋44:29

感觉现在你的想法变化了 ,因为你也开始做 Tripo Studio, 所以好像就是你觉得大家都到 1080P 撞墙了 ,但不会担心有一天竞争的时候搞了个 4K 出来 。

宋亚宸44:42

它跟撞墙没有关系 , 它其实是这样子的 , 原来我们就是打算要做 Tripo Studio 这件事情 , 我觉得这件事情是重要的 。

但是呢 , 我们原来想一上来做一个 UGC 版 , 就是你可以理解为就是零门槛 、 零成本 、 实时的创作 3D 内容的这么一个东西 , 它面向的是真正的 UGC。

那为什么先做一个 PGC 的东西呢 ? 我们认为说在早期其实 , 比如说我举个例子 , 比如说我们说的这个东西它从 10 分到 20 分到 50 分到 60 分到 70 分到 80 分 ,其实可能对 UGC 和 PGC 来说它都是有对这个东西有需求的 。

直到可能要到 90 分的时候 , 到 90 到 98 或者 90 到 99 的过程中,UGC 要的东西和 PGC 要的东西会不一样 。 就比如说 UGC 要求速度好 ,PGC 可能要求比如说更精细 , 对吧 ?UGC 可能更关注的是它能简单的动起来 ,PGC 可能关注的是拓扑结构和布线 , 对吧 ?

就是我只是随便说一些啊 ,但是核心的点是在于说 ,但是早期的时候你至少生成得是得是个东西 , 然后这个东西它至少能简单的去调整 。

所以呢 , 我们先做了一个 Tripo 的 Studio, 就是先把现有的用户先服务好 , 然后再去服务原生的用户 。 原生的用户就是指原来它没有进入到这个生产管线中 ,在这个生产关系中参与生产 ,但因为有了 AI 它可以参与生产 , 像我就是 AI 原生用户 , 就是我没有做 3D 的能力 , 所以我原来不在这个生产关系当中 ,但我如果有了 AI 我就可以参与到生产 。

但我觉得我们先服务的是现有的 PGC 用户 , 先服务于他们把我们的整体实力先提升到比如说八九十分这个级别 。

我们那个时候开始要关注说 OK 了 , 我们是不是要把 UGC 这些人给服务好 , 那服务好的话 , 那就是怎么去服务像我们这样的 PUGC 的一些 , 甚至是 UGC 的一些需求 。

所以说我们在今年的 , 就去年年底的时候到今年, 我们大概招了 20 多个人的完全的产研团队 , 就是产品工程团队 , 对 , 就是专门去解决产品问题 、 工程问题 , 然后去允许大家去做调整 、 去做预设 、 去做比如说你想要这个 3D 模型它有风格化 , 甚至我上传一张图片我会提取里面的风格 , 现在就是风格化 。

我可以允许它比如说做对称性 , 我允许它做 T-pose、A-pose, 我允许它做很多很多这些东西 。 那这个我们认为说可能是第一步 , 就是先把现有的 PROC 给服务好 , 然后下一步再是我们泛化的过程 , 就是逐渐走向 PUGC 和 UGC。

那那个时候它很重要的点 , 除了工程和产品以外, 还有像运营和增长 。 我们现在是没怎么做运营和增长的 ,因为现有的用户大家其实都关注我们的东西 , 那我们的效果好了大家自然会去用 。

但是 PUGC 和 UGC 不是的 , 像我这样子的人他不会天天去关注一个什么 3D 生成的一个大模型它效果是不是变提升了 , 这种时候你得告诉他 。

就是说我觉得增长这件事情它非常重要的是当两件事情出现了一项的时候 , 第一点就是存在信息差 , 我需要通过增长或者 PD 或者运营的方式告诉大家 , 这是第一 。

第二种呢就是说我们的这个产品逐渐同质化 , 这种时候你会需要去通过增长和运营的方式去告诉他我是有品牌的 , 你要用我 。

但是现在这个阶段我们的产品有差异化 , 同时专业用户没有信息差 , 我们就还没有做均匀和增长 , 所以那个是下一步我们要做的事情 。

Koji 杨远骋48:18

那你会不会觉得做一个产品来去获得用户想要什么 , 这个有点太费劲了 ,因为你也可以通过一些用户调研 , 或者通过其他的手段 , 我不知道啊 , 我只是在想 。

宋亚宸48:29

用户调研 , 当你都在做底层大模型的时候 , 你是没有用户的 , 你的用户是 to be 的 , 所以你就得就做客户访谈了 , 那这个就叫 , 就是你会访谈很多你自己的 B 端的客户 , 然后你问他他的客户他想要什么 , 对吧 ?

其实理论上来说 。

Koji 杨远骋48:48

你理论上也可以找到那些他们的客户啊 , 理论上这个直接对话当然没有那么的 , 就是你好像立即有联系方式 ,但我觉得好像花一点精力也能搞到他们的联系方式 。

宋亚宸48:57

我觉得还是那样 , 还是那句话吧 , 就是我觉得初心是不一样的 , 就是我并不知道什么 DeepSeek 他们的初心是啥 , 我不太了解哈 , 我也不知道什么 Temia 大家的初心 , 每家公司的到底想干啥是不一样的 。

就是我们想就想做这件事情 , 就是我们并不是说想要做 I don't know, 就是 AI 3D AGI, 就 I don't know what is that,但是我不觉得我们公司的初心是这个 。

我们的公司的初心它就是希望能够去诞生一个 UGC 的 , 就是 3D 内容的一个平台 , 然后我们看到说 UGC 的这个团体 , 这个用户群体 , 这个创作群体 , 尤其是他们缺乏一个大众级别的创作工具 , 所以我们希望给他打造这么一件事情 。

就这个事情我觉得是很核心的 。

Koji 杨远骋49:42

这个还是蛮重要的一个公司的愿景的选择和在这条路上坚定的一些战略的一些决策 。

宋亚宸49:50

就是它就是这么个事情 , 就是因为它我才做了这事 。 不能因为吃我包饺子 , 对吧 ? 但核心点是我们就是为了这事出发的 。

Koji 杨远骋50:00

那现在 Tripo Studio 其实上线之后应该数据不错嘛 ,因为刚才其实提到它现在已经贡献了超过一半的收入 。

那你从这些 Tripo Studio 的用户里面看到了哪些来自他们的很有价值的反馈 , 可能在你做这个产品之前没有得到的一些 insights。

宋亚宸50:17

我们其实有一个 program 叫做 CEO program, 叫做 Chief Experience Officer, 就这个 program。

Ronghui50:25

听说你访谈了很多人。

宋亚宸50:26

对对对 , 现在应该有一两千个被访谈的实际的用户 , 这些用户真的是来自于各种各样的地方在做各种各样的事情 。

我觉得特别是超出我的预期的是 , 很多实际的用户他在使用的场景是我根本没有想到他会用 。在做这件事情的时候 , 我们最一开始想的就是大家可以做游戏 、 做动画 、 做 3D 内容 , 然后就感觉这个东西能把 3D 内容做好 。

然后后来发现说 OK,其实很多人在做设计 , 就是 3D 打印 、 工业设计这些东西 。OK, 好 , 那我们就把它说 OK, 那这个东西是 3D 内容 、3D 体验 、3D 设计 ,是这么一些 。

然后后来发现大家在搞艺术 , 我们有大概很多用户他是这个艺术院校的应届毕业生 ,他用来干嘛 ?

他用来做毕设 。他可能当代艺术啊 、 装置艺术啊 、 景观艺术啊 , 然后什么这个各种各样的艺术啊 , 什么这个新媒体艺术啊 ,他都可以用 3D 生成然后来搞 。

自己本来就不会做 3D, 还用 3D 生成来搞 。 我们还有很多这个残障的伙伴 ,因为我们这个东西是表达自己去创作这个 3D 的一些工业设计啊 , 包括一些内容 。

我们有很多一些是 XR 的一个种应用的用户 。 我会发现就是原来我对 XR 的关注感觉主要在硬件上, 对于软件和应用上其实是比较少 , 大家其实也不怎么关键软件和应用 , 大家更多说哦 , 今天他这个硬件又迭代了 , 明天他这个硬件又迭代了 。

对 ,但是其实在世界上是有非常活跃的 XR 的应用的群体的 ,他们每天在开发各种很有意思的东西 , 可能是一个 3D 的 PPT, 可能是一个这个 3D 的 AI 绘本 , 可能是一个这个 3D 的一些小游戏 , 各种各样的好玩的东西 。

然后我们发现 3D 原来想说啊 , 大家可以做一些 UGC 了 ,但更多说大家可以把它做用来做玩法 , 大家去把这个东西做成言出法随的一种新的玩法 。

因为在游戏这个行业里面 ,其实我们已经很久没有看到一个新的玩法诞生了 。 过去的可能十年里面 , 实实在在算诞生的玩法 , 可能也就只能算是一个什么自走棋 , 我不知道算不算 ,但是就是没有什么新的玩法诞生 。

但 3D 生成带来了很多新的一些玩法和交互的可能 , 这个也是我之前没有那么想到的 。

Koji 杨远骋52:51

这些都是 Tripo Studio 做了之后你才发现的吗 ?

宋亚宸52:54

Tripo 其实上线了嘛 , 然后大家都在去用 , 然后有些人用它的 API,有些人用它的 SaaS,但是我觉得本质来说都是 AI 3D 变成的可能 , 这件事情是很关键的 。

就是我这么说吧 , 就是 AI 3D 这件事情大家 take for granted, 这件事情很神奇 。 首先大家觉得生文生图 、 生视频当然应该生 3D 了 , 所以大家没有觉得什么 。

我说一直 , 然后大家觉得啊 , 好吧 , 那大家有了 AI 3D 吧 , 这种感觉 。 但你仔细想想看 ,是说原来你嗯一下, 你这个东西啥都没有 , 你现在嗯一下它出来一个东西 , 这就是不管叫做马良的神笔也好 , 还是说叫做言出法随也好 , 还是叫新轧石 , 还是叫什么都可以 , 就这个东西它跟魔法一样哎 , 对吧 ?

这是第一 , 对吧 ? 第二就是我觉得现在这个真的是技术发展速度太快了 , 大家天天看奇观 , 就是刺激了大量的这个不管是视觉上的还是精力上的这种 , 大家已经没有那么多思考 。其实在想一想说 , 这是人类刚刚发明这个技术 , 发明了三年不到两年多的时间 , 然后在短短的三年之内 , 这个技术已经成熟到已经可以在产业里面应用了 。

你想冰箱啊 、 电灯啊 、 什么电啊 , 这些东西发明了以后三年的时候才安载在这什么地方 , 对吧 ?

那现在哇 , 这个东西已经在很多 , 还有很多投资问我说哇 , 这个东西很多游戏行业还不能完全用起来 , 你们是怎么想的 ?

我说我怎么想的 , 我说这用起来就很好了 , 我很感激它用了 , 对吧 ? 它还要我怎么想 , 我就不怎么想了 , 我觉得已经非常这个 appreciate 了 , 对吧 ?

就你想 , 人类刚发明出来三年的技术 , 然后这个技术已经成熟到已经有几百万人在用它了 , 已经有四万多家企业在用它了 , 这是一个非常非常我觉得牛逼的事情 ,但是大家不这么觉得 ,因为最近发明太多了 , 对吧 ?

当然就是我也不说我们这个发明最重要啊 ,而是说就是我自己每次静下来细心想一想 , 我觉得其实 3D 生成是拓展了人类大众能力的边界的 。其实你想想我们说文生图 、 文生视频 , 包括一些什么文生文其实这些人类它是 , 尤其是大众它是有能力做的 , 它不是没有 。

那比如说拿手机上头不能拍照吗 ? 我也可以拍 , 我可以拍视频 , 我也可以拍打字法 , 我也可以打字 。

就这件事情它并不是一个 bonus, 它可能是多了一个选项 ,that's it,也挺好 , 确实也实实在在多了个选项 , 我觉得 great, 对吧 ?

但它一定是不如原来你干不了 , 现在能干了 。 这件事情很夸张的 , 好吧 , 对吧 ? 就是你现在每一个人都可以造一个万物了 , 这事情不是一件小事情啊 。

那当人类大众的能力边界每次得到拓展的时候 , 就像一个圆 , 它的这个直径在变长一小段的时候 , 它跟周围的所有东西都会交叉打结的 。

我经常会举些例子 , 我说你有没有发现菜单在打字法出现之前都是手写的 , 它没有打印的菜单的 。

有了打字法出现了打字的菜单 , 然后有了手机摄像头出现 , 注意手机摄像头不是拍照的 , 你有了相机没有用的 , 手机摄像头出现了以后, 你出现很多菜单带那个图片了 , 对吧 ?

然后现在你甚至可以看到说哎 , 我每个人手上拿了个 iPad, 你在 iPad 上面点 , 对吧 ? 或者你扫码二维码点一下, 那为什么菜单不能是 3D 的呢 ?

其实理论上来说 , 我们经常出去要点十个人的菜 , 多少凉菜 , 多少热菜 , 菜牌有多大 , 鱼肉素菜点了多少 ,有哪些主食 ,有哪些甜点 , 我根本是一看 OK, 点了五十道菜 , 好 , 那这五十道菜够不够吃 , 对吧 ?

发现里面十碗是饭 , 对吧 ? 那这五十是多还是少 , 完全不知道 , 你要点开那个购物车在那边扫 , 扫完了以后够不够 , 还是不知道 , 还是服务员你来看一下, 这个东西够还是不够 , 服务员说差不多 , 好 , 那就差不多 , 对吧 ?

但理论上来说它也可以生成 , 它就可以有一个桌子 , 然后每次它把可以把这个 3D 的这个放在上面 , 你可以转一圈 , 哦 , 这样子 , 对吧 ?

你拿起来你一看就非常明了 , 这十个人够不够吃 , 很清楚 。 那为什么不是这样 ? 因为 3D 的建模成本太贵了 , 你找一个餐厅你说大哥我给你一百万 , 我就给你做一个 3D 的点菜系统 ,他说你脑子有问题 。

但现在你跟他说哎 , 你只要每年你只要交十五派 , 你就可以获得一个 3D 的点菜系统 ,他说那我就交了呀 , 对不对 ?

那你说菜单是可以变化 , 那什么东西是不能变化的呢 ? 比如说广告牌是不是可以变化的 ? 当然可以了 , 名片是不是可以变化的 ?

我觉得当然可以了 ,有什么东西是不能变化的呢 ? 它凭什么名片上就得有文字 , 只能有文字的 ?

为什么名片上它现在可以带头像了 ? 就你会发现说所有的东西它都是可以是 3D 的 , 只是还是那句话 , 互联网它不成熟 。

解压缩57:26

宋亚宸57:33

所以在文字 、 图片 、 视频 3D 的过程中 ,其实我们经常说它是一个升维的过程 ,其实我们的思维方式应该是变化过来 , 就其实是 3D 视频 、 图片 、 文字 , 它是一个不断的降维和抽象的过程 。

因为我们的科技不够发达 , 所以导致我们被迫去用一个极其抽象和信息密度低的方式去进行交流和沟通和展示和分享 。

但是如果我们的科技足够发达 , 对吧 ? 当然 of course 我们本身 , 对吧 , 这个世界 , 对吧 , 现在发明都不是很在意了 , 对吧 ?

所以说这科技肯定发展速度越来越快的过程中, 是不是说当它到完成期的时候 , 它最终还是会环顾归真到我们的 3D, 对吧 ?

你应该用 3D 去做表达 , 去做分享 , 去做展示 , 对吧 ? 说难听点就是我就装个逼 , 对吧 , 去吐个槽 , 去这个发泄一下自己的不满 , 这才是我们应该做的事情 。

Koji 杨远骋58:30

我觉得这个还是描述了非常这个让人向往的一些未来 , 包括比较本质的在思考 , 就是我们现在之所以看短视频而不是看 3D 的东西 , 还是因为今天技术所限 、 带宽所限 、 设备的运算能力所限 , 所以我们仍然在压缩这个世界 。

宋亚宸58:44

压缩这个词非常好 , 就是你就在压缩这个世界 ,exactly。

Koji 杨远骋58:48

回到我前面那个问题 , 你刚才说这个是因为你希望拿到一些认知 , 可以帮你更好的迭代模型 ,因为没有这样的认知 , 好像这个模型再往前也不知道这个 4K 在哪条路了 , 那我就比较想知道做了这几个月之后, 你拿到了哪些来自用户的之前得不到的 , 一定要靠这个 Tripo Studio 这个产品才能拿到的认知 , 然后你确实讲了一些 , 你访了几千个用户 ,但

我听起来好像这个确实也不是 Tripo Studio 这个产品必须要做 , 你才能访到他们 , 你才能拿到刚才你讲的这些认知 。

宋亚宸59:15

嗯 ,其实是有很多的 ,而很多这些事情其实它是就这么说吧 , 我们有一个需求池 , 我们这个需求池里面有上百条需求 , 当然有些是 P0,P1、P2、P3、P4, 可能 P5 就后面就根本就没有来得及做过 , 就在解决前面 , 对对对 , 解决前面的一些问题 。

你会发现说这些需求都是来自于用户 , 比如说有些用户说我举个例子 ,他想要编辑贴图 , 所以我们才有了智能笔刷这个功能 , 比如说他想编辑几何 ,但是他可能又不知道怎么编辑几何 , 这个时候我们就会在研发 , 比如说能不能用自然语言的方式去编辑几何 。

那比如说他说 OK 了 , 我想要更好的拓扑结构和布线 , 那你就要给他重拓扑这个能力 。他比如说我希望有一个更好的一个几何 ,他可能也很难表达出这更好几何是什么 , 我们就得去问他什么叫更好的几何 , 最后发现说他想要的是更好的硬表面 , 对吧 , 更好的拐角 , 对吧 ?

那时候哦 , 这个事情是你们很在意 , 为什么很在意 , 对吧 ? 还有人说啊 , 我希望你能够保留我贴图的笔 , 还有很多人说哎 , 我想要去在这个 UV,UV 的完整性和 UV 顶的提升 ,有很多 , 就你会发现说有很多很多 , 我们当然解决了大部分 , 我们也不是大部分 , 我们解决了很大一部分 , 各种各样的一些需求我们已经在解决 , 当然还有很多还没有

解决的一些问题 , 还是非常细碎的 ,但有很多是你迭代了一版大的模型你自然都解决了 , 比如说这个人脸的精细度啊 , 比如说这个硬表面啊 , 比如说这个一些这个之前还说要 PPR, 现在也有了 , 对吧 ?

各种各样的一些问题 , 那包括比如说原来这个贴图不够好等等这些问题 , 哎 , 迭代了一个大模型版本 , 很多问题都解决了 ,但有些你可能得专门有一些针对性的一些 AI 算法去解决 , 这种我们也在做 。

所以说还是那句话吧 , 就是最终还是服务于用户的 , 还是服务于创作者 ,不是服务于我们自己 。

Ronghui1:01:22

就是这个世界是在压缩的过程中, 然后你们在做的是在给它升维的一个过程 。 我觉得也不能说是相反 ,但我觉得就是听起来是一个比较挑战的路 。

那你是比较相信当工具可以做得越来越简单 , 人是会选择去做升维的创作的吗 ?

宋亚宸1:01:39

它其实是一个解压缩的过程 , 就你会发现说人类之所以压缩是因为比如说带宽太小 , 对吧 ? 比如说跑不动 , 对吧 ?

各种各样的问题 。 我举个例子 , 我觉得非常简单 , 我们说游戏吧 , 你刚刚说的低模和高模 , 对吧 ?

人类不是天生喜欢低模 ,因为低模本身精度就很差 , 看起来护不拉几 , 对吧 ? 人不是天生就喜欢玩传奇 , 对吧 ?

它的画面就是不好 。 那为什么人玩传奇呢 ? 是因为那个时候咱们的互联网只能支持这玩意 , 你要支持高一点就挂了 , 对吧 ?

但是为什么现在大家喜欢玩黑神话悟空 , 对吧 ? 它的面数就比传奇肯定是要高太多太多太多倍了 , 对吧 ?

就是因为解压缩了嘛 , 就是人终于能够环顾归真了嘛 , 对吧 ? 那一样的道理啊 , 对吧 ? 就是你会发现说为什么大家从推特 、 微博 , 对吧 ?

然后再到小红书 , 再到抖音 、 快手 、TikTok,其实它其实它是一个逐渐解压缩的过程 。 就人最早的时候 , 对吧 ?

它是就是这么说啊 , 就其实 3D 本来是最贴近大家的 。 就你会发现说我们就看看文物 , 对吧 ?

最早出现的永远是一些雕像 , 比如说我们看这个良渚的 , 对吧 ? 还有说一些就是最早在这个我们大家叫史前文明 , 史前文明就是在文字出现之前 , 就已经快有很多这种雕像 , 对吧 ?

就是那种哎 , 雕成一个什么小龙啊 , 小的那种什么吉祥 ,不叫吉祥物 , 那个叫什么东西 , 就崇拜对象嘛 , 对吧 ?

就有很多这种东西 , 图腾 , 对 ,exactly, 对吧 ? 然后再是画画 , 就大家会在那种洞穴里面会发现就是什么捕猎的动画 , 哎呦 ,不是动画 , 就是画画 , 对吧 ?

说哎 , 这些怎么怎么样 , 对吧 ? 它已经开始有图片了 , 对吧 ? 然后再往下才是文字 , 就出现的文字已经是很后面 ,在龟壳上面刻字已经是很后面的事情了 , 对吧 ?

就是原来人就是天然的 3D 的一种动物 , 它就是通过信息密度这种最高的方式去表达自己的 。 但是逐渐它发明了信息密度更低的东西 ,但是因为信息密度低 , 所以它可以更好的传递 ,因为这科技差嘛 , 对吧 ?

就是你不能老是带一坨雕塑 , 对吧 ? 你这个东西没法告 ,但是你可以带一堆龟甲 , 对吧 ? 那这个东西哎 , 给你一篇篇发 , 哎 , 你就大概了解什么情况 , 是一样的道理 。

那互联网肯定比那个时代要更牛逼一点 ,但它同时还是遇到相同的问题 , 对吧 ? 就是几个 B 的东西好搞嘛 , 对吧 ?

几个 G 的东西就不好搞嘛 , 对吧 ? 那 3D 可能是几个 T 的东西 , 那更不好搞了 , 那这无非就是有这个问题 。

所以我觉得它不是一个压缩的过程 ,其实科技越来越发达 , 它其实是允许它越来越解压缩了 。 那么当它解压缩到极致的时候 , 能原文件的时候 , 那原文件是什么嘛 ?

那就是 3D 嘛 ,因为你 3D 的时空的原文件不就是 3D 嘛 , 对不对 ? 你仔细思考一下视频是什么 ? 视频就是在 3D 的世界里面找个位置 , 找个角度 , 拍摄一段时间就叫视频了 , 对吧 ?

那其实什么是 3D 嘛 ?3D 就是你不要搞什么位置 、 角度 、 什么时间 , 你就在这个里面 , 你就在那里 , 对吧 ?

这是最本质的嘛 , 就回归本源了 。 所以你可以理解为我相信互联网逐渐走向最终的成熟 , 它就是一个解压缩到极致 , 就是最终环顾归真 , 你能每个人都能享受原文件的时代 。

Ronghui1:04:46

那就是现在做 3D 大模型的人也越来越多了 , 你能不能跟我们讲一讲 , 就是在你看来比较有实力的几个竞争对手和他们分别都选的是什么路线 , 跟你们有什么样的差异 ?

宋亚宸1:05:00

哎呀 , 这个东西就非常难回答 。 实话实说呢 , 又觉得在黑他们 ,不实话实说呢 , 又觉得我比较虚伪 , 这事情怎么办 ?

Koji 杨远骋1:05:10

那就回答一些简单的问题吧 , 比如说所有的竞争对手里面 , 你日常看谁的新闻看得最多 ?

宋亚宸1:05:16

最近 。

Koji 杨远骋1:05:17

就谁的新闻一出来你还是比较关注 ?

宋亚宸1:05:19

最近那个 。

Ronghui1:05:20

对 。

宋亚宸1:05:21

最近混元 3D 做得挺好的 , 我们也在看他们 , 对对对 。

Koji 杨远骋1:05:25

有没有哪个竞争对手是你觉得就是稍微有点尊敬 、 佩服 ,而不是完全觉得他们真的这个 ?

宋亚宸1:05:34

我们都很尊敬的 , 我们这些竞争对手怎么能不尊敬呢 ? 都很尊敬 ,但长期可能大家不是竞争对手 , 大家可能长期是一个竞合的关系 , 对吧 ?

就因为我们就还是那句话 , 大家初心不一样 。 有些人是想要做最牛逼的技术 , 对吧 ? 有些人想做技术影响力 , 比如说混元嘛 , 对吧 ?

也有些人想要就好好做工具 , 对吧 ? 你比如说有些你们可能了解的竞争对手 ,但是我们最终可能想要做的是那个东西 。

就以我所知 , 我们现在的所有竞争对手里面 , 没有人想要做我们想做的事情了 。 所以终究大家还是会走到不同的道路上 。

Koji 杨远骋1:06:07

你们想做的就是 UGC 的一个 3D 的一个社区 ?

宋亚宸1:06:10

呃 , 对 , 就是我们就是服务于创作者 , 这些创作者需要社区 , 我们就通过社区来服务他们 ,他们需要平台 , 我们就通过平台来服务他们 。

就是我们希望说能够给大家去把哎 , 你刚刚说的那个我觉得太牛逼了 , 就是解压缩解到底 , 我们在做这件事情 。

Koji 杨远骋1:06:26

但是难道别的友商们不是想服务创作者吗 ?

宋亚宸1:06:31

嗯 ,不太就是 , 还是那句话 , 就是你比如说有些人他是服务游戏公司的 , 对吧 ? 游戏公司他需要什么 ,他就给他什么东西 , 对吧 ?

然后有些人他可能是这个希望做工具的 , 对吧 ? 但是我们希望的提供的是一个网络嘛 , 是一个社区嘛 , 一个平台嘛 , 对吧 ?

这个事情嗯 ,long way to go, 非常 long way to go, 它不是一个短期能搞完的事 。

Ronghui1:06:54

那你对商业化这个怎么看呢 ? 因为比如说听起来服务游戏公司 , 这是一个听起来比较明显离收入比较近的一个方式 。

宋亚宸1:07:03

我没有觉得服务游戏公司是一个离商业化比较近的东西 , 比如说我们看这个世界上服务于游戏公司的公司 , 好像日子都没有过特别好 。

你可以举反例啊 , 就是你可以举一个 , 你说不行 , 我就觉得这个他们服务游戏公司 ,他们日子过得特别好 , 对吧 ?

就是你好像很难举一个反例 , 所以听上去 , 对吧 ?To B 的 , 对吧 ?To B 服务于游戏公司的公司 , 好像你很难找到一个反例 。

Ronghui1:07:30

那你对你们商业化这个怎么看呢 ? 就是你对它的这个规划是什么样子的 ? 然后过去两年它在你规划的这个路线上吗 ?

或者是有什么意外给你吗 ?

宋亚宸1:07:43

我觉得嗯 , 还是那句话 , 就在早期产品的本质不是产品 ,是技术一样 。 就是商业化的本质真的是商业化吗 ?

就这个也是一个问题 。 就是我们刚刚讨论了 , 你会发现说增长和 BD 它的作用存在于说当你的产品同质化严重 , 这是第一种 。

第二种就是当你的用户存在非常大的信息差 , 当如果这两件事情形成了一个的时候 ,BD 和增长就会有非常大的意义 。

但是当这两件事情都没有出现的时候 , 那核心的事情是不是进一步把产品做好 ? 就是商业化的本质在这个阶段我觉得是产品 ,但下个阶段是什么 , 我们可能可以再看 。

就是我觉得很多东西的本质不是这个东西本身 ,在现在这个阶段 。

Koji 杨远骋1:08:31

就你听起来就是简单说啊 , 就是我感觉我可能有个比较糙的话 , 就是觉得产品还不够好 , 还不值得拿去推广 。

宋亚宸1:08:39

嗯 , 这是两件事情 。 就像你说技术还不够好 , 所以说产品不能做 , 就我觉得不是这个意思 。

就是说就是产品更好 , 把产品做得更好 , 比陪别人吃饭更关键 。 就你也不能说啊 , 英伟达的产品做得不够好 , 所以你还不能办法去做商业化 ,不是这个意思 , 对吧 ?

但人家就是不做商业化 , 人家没有销售吧 , 人家天天往那个自结百度卖吗 ? 没有吧 , 对吧 ? 因为产品足够好 , 那对于他来说 , 产品做得更好 , 比陪别人吃饭更合理 。

所以一样的道理 , 对吧 ? 对我们来说也是 , 第一 , 如果你的客户没有那么大的信息差 , 第二 , 你的产品有足够多的差异化 , 你就应该把产品做得更好 ,而不是去招更多的 BD 请别人吃饭 , 或者说去买更多的广告去做增长 。

所以我觉得是这么个逻辑 。

Ronghui1:09:29

我看你在好几个采访里面其实都讲了同一句话 ,是说你在每年年底的时候会跟公司分享一下这个应该是愿景吧之类的 , 然后说这个去年是应该是第三年讲 , 然后讲说每年讲的都是类似的 。

就是你可以说一说你在创业这两年多来 ,有哪些是没有变的 ,有哪些是变了的 。

宋亚宸1:09:54

嗯 , 对啊 , 就像你说的 , 每年这年初的时候 , 大概三月十几号的时候 , 然后每年的三月十几号都会有一个全员的分享会 , 然后我基本上非常简单 , 就是把之前的 PPT 截个图 , 然后放到现在来就可以讲 , 然后稍微调整一下 ,因为又往前多做了一年, 然后 milestone 又完成了一些 。

但你会发现说最终的愿景 , 中间的路径其实是没有怎么变化的 。

Koji 杨远骋1:10:25

所以你的天使轮 BP 和现在的 BP 变化不大 ?

宋亚宸1:10:28

天使轮没有 BP,但是确实在内部讲的时候 , 那个 PPT 和现在 PPT 没有变化 。

Koji 杨远骋1:10:32

有趣 ,有趣 。 我最近听到一个小故事 , 就是这个王慧雯最近去见一个创业者 , 她请他把她的天使轮 BP 拿出来 。

天使轮 BP 是大概四年前 、 五年前的 , 然后他们做过一些转型 , 然后请她再讲一讲天使轮的 BP 和现在的一些什么变了 , 什么没变 。

宋亚宸1:10:49

哦 , 对 , 我们其实很好讲 ,因为我们真的是没有什么变化 。 每次我想有一些变化的时候 , 团队都很反对 , 所以也很难变化 。

大家对于愿景和路径已经有非常强的认知和认同感 , 这我觉得也是我们团队非常强的地方 。 我们团队几乎没有这个人才流失 , 很大的原因就是因为我觉得我们团队是一个长期主义且有信仰的一个团队 , 大家真的对自己的愿 , 对我们的这个愿景和路径是保持着强烈的热爱和认同的 。

对 , 所以说

呃 , 再过小半年, 再过半年我可能又要分享了 。 我希望分享的时候 , 就第四次分享还是讲一样的事情 。

Koji 杨远骋1:11:34

大家对这个愿景的就强烈的认同和持续已久的这样的 , 就持续不变的认同 ,是因为大家本身也是用户吗 ?

就自己期待用上这样的产品吗 ? 还是因为别的什么原因 ?

宋亚宸1:11:46

我觉得肯定一部分同学是用户 , 然后另外一部分同学是真的看到了这件事情确实在往我们像我们想当时说的那样子发展 。

就是它一步一步发展 , 甚至比我们想象中的要快一点 。 所以我觉得这件事情是非常打动人的 。 就你比如说你在五年前讲了一个故事 , 然后这五年前它是一个故事 ,但你现在看到的这五年每一年发生的事情 , 就像你说的那样子发生了 。

就这件事情它是非常的有力量的 。

Koji 杨远骋1:12:17

可不可以就是最后描述一下, 就是这个愿景如果真的有一天发生了 , 它是一个怎样的一个画面感 ?

第四产业1:12:21

宋亚宸1:12:22

怎样一个画面感 ? 我们说一件事情吧 , 就是其实在农业时代到工业时代 , 然后再到服务业 , 对吧 ?

现在我们就三大产业嘛 , 对吧 ? 其实我们认为说其实有第四大产业就是内容行业 , 对吧 ? 就是其实就做内容和体验 。

我们认为说可能未来人是不产生物理的价值的 ,因为所有的 physical value 它都是被机器人给做成的 。 你在物理世界你能产生的价值是极其极其有限的 , 你们很难想象说机器人能做什么事情 , 就是人能做什么事情机器人不能做 。在物理世界我觉得非常有限 , 对吧 ?

但是呢 , 人的那人总是要有价值 , 对吧 ? 或者我比你牛逼 , 你比我牛逼 , 你是贵族 , 我是农民 , 那肯定是有点小原因的 , 对吧 ?

那这个事情呢 , 它就我觉得就是一个点就是

我的内容和创 , 就我创 , 我的创意是本质 。 那谁的创意牛逼 , 就是怎么去判断呢 ? 就是我制作的内容和体验 , 或者说 some of 所有的人在我创造的内容和体验中停留的时间 , 就是我在这个世界上创造的价值 。

我不知道我能不能够讲清楚啊 , 就是说我在就是所有的人在所有的时间中 ,在我的这个内容 ,在我的世界中停留的总的量 , 就是我对这个世界创造的价值 。

Koji 杨远骋1:14:01

这听起来和你在小学初中的时候干的事情还是类似的 , 就你做了一个游戏 , 然后同学们跑到你这里来玩这个游戏 。

宋亚宸1:14:09

这当然可能不是个游戏 , 它可能是一个 something, 对吧 ? 它不一定是个游戏 , 它可以是 anything, 它可以是在这个里面一起狂扁小朋友 , 它可以是在这个里面一起冥想 。

就是 I don't know, 就是我也不知道大家会干什么 , 这是另外一回事情 。 但是我相信的一个点是在于说 , 人是一个注重于自己体验的一种生物 ,他希望去获得 optimal experience, 极致的体验 。

那他什么时候会有自己最极致的体验呢 ? 就是当他有足够多选项的时候 , 当他有无限的选项 ,但他又可以用脚去投票的时候 , 那他就可以选择自己最极致的体验 。

那怎么可以拥有无限的体验呢 ? 就是用 UGC, 用 AIGC 的工具去创作 , 那么就可以无限体验 。 比如说抖音里面的视频 , 接近于无限 ,不是无限 , 那接近于无限 , 对吧 ?

那当你又有推荐算法的时候 , 那你的体验当然更好 , 就是废话 , 对吧 ? 当然更好 。 那么那因为这件事情非常的 fair, 就大家投票投得非常的 fair,因为投的是自己的时间和关注 , 对吧 ?

非常非常的 fair, 非常公平 。 所以未来你是不是一个最有钱的人, 最富有的人 ,其实我觉得很有可能就是你真的非常有创意 , 你做的这个世界所有人都喜欢来玩 , 大家都在你这个世界里面来花时间 ,但大家都花时间 , 可能不知道为什么来玩 , 可能大家你做了一个小偷模拟器 , 哇 , 一堆偷窃屁在你这个里面 , 哇 , 偷得贼爽 。

哎 ,不知道 , 哎 , 你不知道大家为什么来你这玩 。 那个时候你就会获得很多这样子的钱 , 就是钱是干嘛的 ?

就算力 , 就是你的推荐算法比别人好 , 你知道吧 ? 所以你的体验会比别人好一点点 。 我不知道你看过那个 upload 没有 , 就是那个那个那个美剧 , 那个 upload 里面就叫上传人生嘛 ,是吧 ?

那个 upload 里面有一句很有意思 , 就是你在现实中要给它充钱嘛 , 当你充的钱少的时候呢 , 它就会很卡 , 就是它就会很卡 , 就是不太好动 。

对 , 然后你要是就疯狂给它钱的时候 , 它就 5G, 哇 , 它就贼流畅 , 你知道吧 ? 一样的道理 , 就是未来也是这样子的 , 就是算力嘛 , 对吧 ?

你就是你就给这个大众 , 哇 , 创造了绝对的欢乐 , 哇 , 那这种时候你就特别特别爽 , 你的这个推荐算法给你推荐你最喜欢的内容 , 然后你有各种各样的工具可以用 , 你可以用 Tripo, 你可以用 Midjourney, 各种用 , 对 , 然后就创更牛逼的东西 , 对吧 ?

然后各种 agent 陪着你 , 那种比如说创意拉的人, 他就没几个 agent,他就可能一两个人用一用 , 对吧 ? 然后这个 API 也没什么好用的 , 然后创意不出来什么好东西 , 就可能未来我觉得可能是这样子的 。

Ronghui1:16:47

我想补充两个问题 ,是你对行业的一个个人的感知 , 就是那这两年来你会觉得就是 AI 创业的这个行业 , 你自己的体感是怎么样子的 ?

宋亚宸1:16:58

我觉得很幸运啊 , 我觉得生在这个时代还是很幸运的 , 当你是有一些钱能够能启动的 ,有一些资源的 ,但同时呢又不是过多 , 对吧 ?

它也不是一个资源的诅咒 , 没有一个伟大的公司是诞生在一个资本市场极度好的时候 。 所以说它是一个合理的 , 保持你饥饿的这么一个环境 , 我觉得非常非常的值得感恩 。

Ronghui1:17:27

你如果现在可以对两年前决定创业的自己说点什么 , 你现在想说什么 ?

宋亚宸1:17:32

我真牛逼啊 , 卧槽 , 创了对 , 真牛 , 真有勇气 , 卧槽 , 我真觉得我觉得是个人物 , 对 , 我觉得创对了 , 我觉得真应该创业 。

Koji 杨远骋1:17:44

所以你受过什么苦吗 ?

宋亚宸1:17:46

那肯定啊 , 我觉得创业是有很多困难 , 那肯定是每天要解决很多很多很多的问题 , 这是肯定的 。

Ronghui1:17:56

有什么化解痛苦的方法吗 ?

宋亚宸1:17:58

哦 , 化解痛苦 , 我玩游戏啊 , 我玩龙与地下城啊 , 我因为就是当你的物理世界是你所有的世界的时候 , 那你的物理世界是痛苦的 , 你的人生就是全部痛苦 。

当物理世界只是你百分之四五十的人生的时候 , 你至少还有一半是不痛苦的 , 对吧 ? 所以说你就很缓解嘛 , 对吧 ?

对 , 就无非就占比问题 , 就是你如此的注重神创造的世界 , 那神创造的世界就可以左右你的所有的心情 。

但是你还有很多人创造的世界的时候 , 那么神创造的世界只是你的人生中的一部分而已 。

Ronghui1:18:31

我有看到你在另外一个采访里面说 , 我是一个非常需要虚拟世界的人。

宋亚宸1:18:35

那肯定 , 那必须有 , 我觉得每个人三好都需要 , 只是现在大家没有 。

Ronghui1:18:40

OK, 好 , 那我们今天谢谢 Simon 跟我们聊了很多自己不管是做 3D 大模型的一些科普 , 还是说这个做工具 , 然后对整个创业的这个过程的一些想法 , 然后我觉得非常的精彩 。

然后谢谢 Simon 今天跟我们聊了这么多 。

Koji 杨远骋1:18:57

谢谢 , 谢谢 , 期待下次再来 。

宋亚宸1:18:59

感谢 , 拜拜 。

如果你认为有朋友也会喜欢本期 《 十字路口 》 的内容 , 请转发微信推荐给他们 。 最后欢迎你加入 《 十字路口 》 的会员群 , 我们鼓励大家在群里聊天互动交朋友 , 寻找未来的同路人。