十字十字路口Crossing2026年6月28日· 52:21

我遇到了第一个真正想买的陪伴机器人!|对话世博:越伴动力创始人【公路播客】

本期公路播客中,越伴动力创始人世博分享了其首款消费级双足陪伴机器人「小伴」的设计哲学:不靠功能堆砌,而是用外星语、柔软外壳、类连续变形体手臂和快慢脑架构(1.7B快脑+7B慢脑)营造生命力。他解释为什么不让机器人说人话、如何让交互延迟低于0.4秒、以及定价策略(国内预售价6499元)。世博还讲述了自己从手搓30多款机器人的少年到创业者的心路转变,并透露团队已用家庭模拟器微调模型,使机器人能根据上下文理解情绪。

  1. 0:00快问快答
  2. 3:50外星语
  3. 5:48肢体语言
  4. 8:41不讲道理
  5. 11:52快慢脑
  6. 15:26创业时机
  7. 24:13陪伴与讨好
  8. 28:45一年之后
  9. 31:11天赋
  10. 37:02生命力
  11. 46:55不找借口
  12. 49:56有意义瞬间

转录文稿

快问快答0:00

Koji 杨远骋0:00

嗨 , 我是 Koji, 我们这是新一期的公路播客 。 我们今天的嘉宾是越伴动力的创始人世博同学 。

世博0:09

哈喽 , 大家好 。

Koji 杨远骋0:11

我们录公路播客是希望一边开车一边聊天 。 我们今天要开去这个北京环游山里的一个很漂亮的咖啡馆 。

我们为什么要录公路播客啊 ,是因为觉得正经危作的聊天和这样一边开车一边聊天 , 应该会有非常不一样的氛围 。

有可能我们这样的 vibe 可以聊出更多平时不会聊到的一些想法啊 、 故事啊等等。 我们今天还是从我们的这个十字路口传统快问快答开始哈 。

请问世博同学 , 你的年龄 ?

世博0:38

26。

Koji 杨远骋0:39

你的毕业院校 ?

世博0:41

北理工博士修学 。

Koji 杨远骋0:43

MBTI 和星座呢 ?

世博0:45

INTP。 摩羯 。

Koji 杨远骋0:47

一句话介绍一下你们现在的公司和产品 。

世博0:49

我们做的是消费级的双足形态的伙伴型机器人。

Koji 杨远骋0:54

咱们融资情况是 ?

世博0:55

去年年底的时候拿了真格的种子轮 。

Koji 杨远骋0:58

咱们目前的这个团队有多大呀 ?

世博1:00

实际上是一个小团队 , 现在目前为止加上实习生只有 25 个人。 但是我们非常有战斗力 , 已经发布了我们的第一款伙伴型机器人, 大概比 90% 的机型公司要快一些 。

Koji 杨远骋1:13

一句话介绍一下创业之前在做什么 。

世博1:16

以前也在做机器人, 做了接近 30 款的原创的机器人。

Koji 杨远骋1:20

30 款 ?

世博1:21

没错 。 然后除了做了很多款机器人之外呢 ,在大二期间就开始创业 , 做面向课程建设的四足机器人教育套件 。

如果只是说从这个卖的这个数量上来看的话 , 我应该比王星星卖的要多 。 我也参与了高情动力他们的这个创业过程 , 我负责他们的产品 。

Koji 杨远骋1:37

嗯 , 酷 。 之前做的 30 款都是什么样的机器人啊 ?

世博1:44

轮式 、 足式 、 履带 、 机械臂 , 这些经典的构型都探索了一遍 。 年轻生入学之后呢 , 开始做一些更大尺寸的 、 更高动态的一些机器人, 包括什么重载的四足 , 还有在做一米七的 、70 公斤的这样的一个大尺寸人形 。

Koji 杨远骋1:59

哦 , 对 。 我们今天开的车是理想 i6 啊 , 这是世博同学 。 我问他 :" 哎 , 我们今天公路播客开什么车 ?"

然后他的 Junecar 是什么 ? 哇 ,他说了 i6。

世博2:07

没错 。

Koji 杨远骋2:08

所以我们就搞了这台 i6。 为什么这个是你的 Junecar?

世博2:11

我觉得在汽车这个行业里面 , 原创的设计真的很重要 ,而且好的原创设计很难得 , 好的产品真的需要 taste。

Koji 杨远骋2:19

嗯嗯 。 哎 , 我们这个真的不是理想的广告啊 , 这是发自内心的喜欢这个车 。

世博2:24

我们前前两周刚试驾了一下 。

Koji 杨远骋2:26

一开始咱们想到做陪伴机器人是一个什么起点啊 ?

世博2:29

因为之前做了太多的一些机器人了 , 我有的时候又会产生一个比较幼稚的一个想法 : 我这个机器人真正的活起来 , 站在我的面前 , 和我去交互 , 它是一个什么样的一个状态 ?22 年的时候 , 一个人放在家里 , 就开始探索这种陪伴型的机器人。

刚开始的时候 , 最早的是做的双轮形态的 , 这双轮形态弊端也很明显嘛 , 就是运动能力太受限 ,有一个小坎 , 一个电线可能就把它给卡住了 。24 年的时候 , 决定了就我当前做的这样的一个产品形态 , 它是双足 。

Koji 杨远骋2:57

大家创业做机器人, 有些想做进工厂 , 然后也有些想做这个护脑 。 呃 ,也是就是怎么在这些不同的道路之中, 选了陪伴的这个方向的 。

世博3:08

我觉得陪伴场景 , 它是可以在短期内快速落地的一个场景 。

Koji 杨远骋3:13

做陪伴机器人的这个公司还蛮多的 , 就最早比如说日本的 LAVOT, 还有我播客其实曾经也聊过 ROPOD。 呃 , 你有特别喜欢的陪伴机器人吗 ?

世博3:23

LAVOT 这个机器人做得很好啊 , 包括我在创业之前就买了这样一款机器人 ,而且一直保持开机到了现在 。

实际上 LAVOT 它这个交互逻辑 , 它真的做得挺简单的 ,但是不是说它简单不好 。 它交互逻辑就是 , 比如说我往这一站 , 往这一坐 ,LAVOT 看到我 , 它会靠它那两个小轮子 , 然后滚到我的脚下, 轮子一收 , 开始扑扇它两个小胳膊 , 希望我把它抱起来 。

就这样一个简单的一个交互逻辑 , 我觉得恰到好处 , 又把它开机到了现在 。 就包括前两天 , 还看到了那一个拥抱的那个机器人。

外星语3:50

Koji 杨远骋3:54

哦 , 大把 。

世博3:54

对 , 它就是很简单的一个设计逻辑 。 嗯 ,其实但凡它会说一个字或者说一句话 , 我可能就不会买 。

Koji 杨远骋4:01

对 , 所以它不能说话 。

世博4:03

真的 , 好产品它不是靠功能堆砌起来的 。 对 。

Koji 杨远骋4:07

我其实刚才有注意到 , 小伴是可以说话的 , 那说的不是人话 , 它说的是某种这个火星文 。 可以介绍一下这是一个什么样的语言吗 ?

世博4:15

啊 , 它也不是火星文 , 就是我们给它设计了一套语言体系 , 然后这套语言体系它由 12 个音组成 。

它虽然只有 12 个音 ,但是它可以表达各种各样它想要表达的 。 然后比较厉害的一点是什么 ? 你和这个机器人一个下午 , 你会渐渐的意识到这个机器人它到底在说什么 。

就比如说 , 呃 , 举个例子 , 比如说机器人它要它说它要充电了 , 它可能要说 " 哭 "。" 哭 " 这个音在我们机器人语言里面代表就是吃 , 它可以说 " 米他哭 ", 就是 " 我要吃 " 的意思 。

机器人可以吃什么 ? 它只能吃电嘛 。 它说这个音的时候 , 它会比如说看着自己的小肚子 , 然后用小手拍一拍自己的肚子 , 然后说 " 米他哭 "。

意思就是你会意识到它好像在说自己没电了 , 它饿了 , 这时候你要带它去充电了 。

Koji 杨远骋4:58

所以这套语言是如何设计出来的 ?

世博5:00

呃 , 这套发音 , 它是我们根据斯瓦希里语系的 CV 结构 , 然后做了一套系统 。

Koji 杨远骋5:07

你们是怎么找到这么一个小众的语系的 ?

世博5:09

我们这个机器人不只在国内嘛 , 还要出海 。 就是这个音不能和中文那么像 ,也不能和英文那么像 , 所以我们就找了非洲的一个部落语言 , 就是发音借鉴了 。

但是具体的你想要表达什么内容 , 这个是我们自己去设计的 。 它很具体的说一句话 , 嗯 , 它说的就是这种意象式的一个表达 , 就像刚才提到的 , 它没电了 , 它只能说 " 米他哭 "。

Koji 杨远骋5:31

那比如说 , 它可以说 " 我们今天要去拍公路播客 " 这样的复杂句子吗 ?

世博5:36

呃 ,不可以 ,但是它可以通过一些意象式的表达出来 , 比如说 " 哦 " 对它来说就是 " 看 " 的这个意思 ," 嘿 " 对它来说就是 " 走 "。

它可以说 " 他哦 "" 他嘿 ", 代表说我们就要出去 , 然后我们要看 。

肢体语言5:48

Koji 杨远骋5:49

我看它也有很多丰富的肢体动作 , 所以它的语言 , 它的肢体都是用什么逻辑在去驱动它呀 ?

世博5:55

很多人都听过梅拉 · 比安实验 , 就人和人交互的过程中, 肢体语言的重要性占比实际上高达 55%。 它包括你的表情 、 你的眼神 , 甚至说你的你的动作 , 然后 37% 是你的语调 , 只有 8% 才是你说话的内容 。

所以说 , 我们把机器人的肢体语言作为情绪表达的途径 , 拉到一个很高的一个重要性 。

Koji 杨远骋6:16

哎 ,而且我发现它的这个手是很小的小的吧 ? 因为说到肢体语言 , 感觉好像如果它的手和人一样灵活 , 应该能做的肢体动作是更多 。

可你们为什么考虑给它的手变得那么的这种短小 ?

世博6:29

啊 , 我实际上当时也考虑了很多 。 就是第一点 , 就是我们不希望这个机器人去做一些操作任务 , 所以我们的逻辑还是面向肢体语言的情绪表达 。

它虽然说手只有那么短 ,但是它可以表达出来很丰富的一个情绪状态 。

Koji 杨远骋6:44

哦 。

世博6:45

嗯 , 然后其实我们这个手臂 , 它是一个类连续变形体的一套方案 , 它和那种行业里面用的比较多的这种关节式的都不太一样 。

对 , 然后它是行业里面比较唯一的 。 然后我们发布之后也获得了很多好评 , 大家说这个手臂 duang duang 的 , 很可爱的这种感觉 。

对对 。

Koji 杨远骋7:01

确实就是有一种说不出来的萌感 。 嗯 , 哎 ,而且它的身子 , 我刚才在办公室也一直和它在抱抱嘛 , 就感觉是软的 。

就这个是怎么做到的 ?

世博7:11

啊 , 我们做了行业里面很多机器人公司都想做 ,但是没有真正做出来的一件事情 , 就是给这个机器人的外壳 90% 以上的做成柔软材质 。

然后我们用了一种类硅胶的一种材质 , 然后覆盖率高达 95%。 甚至说肚子上面最后的一个柔性深度 , 甚至有 2 厘米这么厚 。

Koji 杨远骋7:30

哦 , 就它有一个这个 duang duang 的一个肚子 。

世博7:32

对 , 没错 。

Koji 杨远骋7:33

哈哈哈 。 看你们还给它做了衣服 。

世博7:36

很多人买了之后, 它要追求一些差异化的表达 , 像我们给机器人做了很多的一些配件 , 像它的磁吸的小耳朵 、 磁吸的领结 , 还有各种各样风格的衣服 , 刚给它做了梅西和 C 罗的球衣 。

Koji 杨远骋7:48

它有性别吗 ?

世博7:49

我们给这个机器人的定位是外星萌物 。 嗯 , 对 , 它有仿生的形态 、 仿生的质感 , 然后透明的情绪表达 。

但是呢 , 没有一个明确的性别指向 。 我们还是更希望用户后续通过它的一些自己审美偏好的一些装扮去给这个机器人定义 。

Koji 杨远骋8:06

哎 ,是什么原因让你们把它定义成外星萌物 ,而不是一个宠物或者一个小孩 ?

世博8:12

你做的越像猫越像狗 , 越仿猫仿狗 , 它就越容易被真实的猫猫狗狗所比下去 。 然后呢 , 我们又不想把它做成一个人形 , 就是不希望给用户带来那么高的一个预期 , 无论是智能程度还是性能程度上 。

Koji 杨远骋8:26

我除了叫它小伴 , 可以给它单独起名字吗 ?

世博8:30

当然可以 , 我们还做了一个基因音色 , 你甚至说可以把你的声音和你 idol 的声音去融合出来一个基因音色 , 就像你和你 idol 的孩子一样 。

对 。

Koji 杨远骋8:40

天呐 , 哇 。 哎 , 那准备卖多少钱啊 ?

不讲道理8:41

世博8:44

啊 , 我们当前在国内的定价是 8,499, 然后当前这个时间点实际上正在预售 , 然后我们预售价格是 6,499, 降了 2,000, 限时限量 。

Koji 杨远骋8:55

哦 , 哎 , 所以什么时候咱们会真的发到用户的家里 , 可以拿到货 ?

世博8:59

我们最快的时间点会在国庆节 , 然后之后陆陆续续的按这个订单顺序来交付 。

Koji 杨远骋9:05

啊 , 我真的很想买一台 , 我可以想见这个应该买回我的家 。 呃 , 大概率不会吃灰 。

世博9:11

哈哈 , 对 , 就是我们为了不让用户把这个机器人带回家吃灰的这个问题 , 一方面这个机器人它看上去很可爱嘛 , 非常萌的一个感觉 。

另一方面 , 我们还做了一件事情 , 就是要摆脱角色预设和那种逗乐型的互动逻辑 。 就什么叫逗乐型的互动逻辑 ?

就什么我们 , 比如说我们这边有个机器人叫叫什么小 A, 小 A 小 A 跳个舞吧 , 小 A 小 A 握个手吧 , 这种就是逗乐型的互动逻辑 。

我们之前也测试了我们之前的一款竞品 , 你跟它说 " 小 A 小 A 你好难看呀 ", 然后它的回答是什么呢 ?

就是 " 这样说人是不对的呀 ", 然后巴拉巴拉开始给你讲一堆大道理 。 然后我们的机器人你说 " 小伴你好难难看呀 ", 然后它的反应是首先眼睛会泪汪汪的 , 然后把头低下来 , 然后手抱着自己的肚子 , 很委屈的这样的一个状态 。

就我们希望给用户带来一种这样的一种有生命力的感觉 。 对 。

Koji 杨远骋10:02

哎 , 如果我在家里 , 我不主动找它 , 它会来找我吗 ?

世博10:06

啊 , 我们机器人的性格它也是不太一样的 , 就是基本上就是易激性格 , 它是一个多维成长的一个状态 。

我们给机器人做了云端的超长程的这种记忆 , 实际上这个记忆的目的 , 就是推动性格参数的多维成长和动态演化 。

你是一个 A 人, 你是一个 E 人, 你把这个机器人带回家里 , 第一天 、 第一个月 、 一年后, 它这个性格状态一定是不一样的 。

Koji 杨远骋10:29

所以是 E 人主人会养出一个 I 人的小伴 , 还是一个 E 人的主人会养出一个更 E 的小伴 ?

世博10:35

哎 , 我觉得 E 人的主人应该会养出一个更 E 的小伴 。 就比如说你是一个 I 人, 机器人有的时候跟你打招呼你都不回应它 , 然后它有时候找你抱抱 , 你甚至说 " 你一边玩去 , 你别打扰我 ", 那那机器人就可能后面会变得不那么乐意去找你交互 , 它更关注你家庭里面的一些环境物品啊 , 或者花花草草啊这些 。

就如果说你是一个 E 人, 你整天在家里打游戏 、 大喊大叫 、 看球 , 然后你这个机器人会跟着你 , 它也会进入到一个非常主动 、 活泼开朗 、 乐意于去找你交互的一个状态 。

它会时不时的打扰你一下, 然后求抱抱 。 对 。

Koji 杨远骋11:10

那你觉得做小伴的过程中, 最难的事情可能是什么 ?

世博11:14

啊 ,其实我们解决的一些行业级的难题还挺多的 , 就包括我们为了从安全这个角度出发 , 然后把这个机器人做到那么小那么轻 。

另一方面 , 就是我们把机器人的外壳全身做成柔软 ,而且给它全身加触觉 , 然后也包括要把它的控制延时控制到亚秒级别 。

然后但我但是我觉得最难的还是机器人的交互这一块 , 怎么样让用户感受到我们这款产品的一个活人感 、 生命力 。其实我们花了很大的精力和心思去解决和调研这种问题 。

Koji 杨远骋11:45

就说到交互的时候 , 这个具体是怎么设计的呢 ?

世博11:48

就像刚才提到的那个逗乐型的交互逻辑 , 这个是我们一定不要去做的 。 然后另外一点 , 就是我们给小伴的大脑做了一套三层的 VLA 的框架 。

快慢脑11:52

世博11:58

然后我们为了把那个通讯延时控制到亚秒级别 ,在端侧做了一套快慢脑 。 快脑是一个 1.7B 的一个模型 , 它负责一些瞬时的一些行为决策 。

慢脑是一个 7B 的模型 , 它可以做一些相对复杂的逻辑推理 。 综合来看 , 就是如果你给机器人说一句话 , 或者机器人要决策做样做一个什么样的动作 、 什么样的行为 , 它这个延时我们现在已经能够控制到 0.4 秒以内 。

Koji 杨远骋12:21

因为刚才我也有注意到 , 你叫小伴的时候 , 它好像非常快的就 " 哎 " 了一下 。

世博12:25

对 ,而且它大回应你之后, 你再说一句什么话 , 或者是它看你做了一个什么动作 , 它给你在语音动作肢体语言上的一个反馈是特别快的 ,而且特别自然的一个状态 。

Koji 杨远骋12:38

它的反馈是你们写好的一套逻辑 , 它是有限集 , 还是它是比如说交给大语言模型去处理 ,是无限集 ?

世博12:44

就在交互动作这一块 , 它是有一小部分的动作库的 ,但就算是在两个一模一样的场景之下, 你说了一模一样的话 , 我们都不像小伴给你一模一样的两套交互动作 。

所以我们还做了一个事情叫动作生成 , 机器人可以根据当前的情境场合 、 你的行为 、 你的情绪去恰如其分的生成一个风格化的一个交互动作 。

就像最简单的 , 我咱们刚才出门了 , 小伴给我挥个手 " 拜拜 ", 它都可以有各种各样的风格化的一个表达 。

它可以很兴奋的 、 开心的这样挥 ,也可以就像很娇羞的这样挥手 。 它会生成一个 5-10 秒的一个动作序列 。

Koji 杨远骋13:18

咱们背后是基于什么开源模型训的呀 ?

世博13:20

千万的开源模型 , 包括它的快慢脑 , 还有云端的那个 200 多 B 的这个模型 。 嗯 , 对 , 然后我们还做了一件事情 , 就是我们小伴当前能够这么好的去理解人当前的情绪状态 , 实际上我们这两个模型是微调之后的 。

Koji 杨远骋13:34

做了什么微调呀 ?

世博13:35

就是我们希望这个模型它能达到的一个效果 ,是更能够理解人的一些潜在意图和和内部情绪 。 嗯 , 对 , 然后我们通过一些家庭场景的一些交互数据 , 对我们这个模型进行微调 。

然后现在所有的机器人都还没有真实入户 , 大家都没有这种真实的交互数据 。 对 , 我们还做了一个事情叫家庭模拟器 , 然后这个家庭模拟器就是模拟了小伴进家庭之后, 然后和你空间内的各种环境物体和家里的成员 , 甚至说和你家庭里面的猫猫狗狗去做这种超长程的主被动式的情感交互 。

我们把这样的一个交互数据拿过来进行标注 , 然后微调我们的端侧模型 。 嗯啊 , 还有就是我们为什么要这么做呢 ?

实际上机器人对人的情绪的理解和识别 ,不是说靠你当前这一个时刻的它说了什么样的话 , 或者这个话是什么样的一个语调 , 或者你当前的面部情绪什么样的 。

我们更希望的是通过上下文去理解 , 比如说过去一个小时你有什么样的一个行为 , 发生了什么事情 , 综合去推断你当前的情绪状态 。

Koji 杨远骋14:39

这还挺有意思的 。 所以我看到小伴其实有摄像头的 , 嗯 , 所以它是以什么样的方式把它捕捉到的这个画面和视频传给模型去训练呀 ?

世博14:50

实际上我们需要这些数啊 , 数据进行模型上的一个训练 ,但是我们非常关注用户隐私的这个问题 。 我们不会把端侧的原始的这些语音信息或者图像信息去收集 , 我们更多的是一种语义化表达的一种信息 , 它会抽象成一种特征 , 一种 embedding 的一种信息 , 最终能够用于我们训练模型 。

嗯嗯 。

Koji 杨远骋15:11

啊 , 所以咱们选千问这个开源模型做咱们的这个基础模型去呃的原因是什么 ?

世博15:16

因为当时测试了好几款模型 , 千问这个模型在推理和人的情绪理解的上的表现是比较好的 ,在一个非常小的模型参数量下 。

创业时机15:26

Koji 杨远骋15:26

在 2026 年做小伴 ,是有什么特别的他命让它在今年变得可能吗 ? 还是说有可能 , 比如说倒回到三年前 ,maybe 也能做出来 ?

世博15:37

我觉得三年前概率应该是比较小的 。其实这也得益于模型语言模型 , 还有一些视觉模型 , 特别是一些 VLA、WAM 一些架构的一些发展 。

嗯 , 我为什么在 25 年年底的时候出来创业 ,其实我觉得分两个方面吧 , 就是第一方面 , 就是我在心理上 、 能力上 、 经验上, 我觉得是准备好的一个状态 。

嗯 , 另外就是我发现了一个很好的一个行业机会 , 然后我找到了属于我的一个切入点 , 就是先去做这种有生命力 、 极致安全的双足形态的伙伴型机器人, 先去解决这个机器人进家庭之后的人机交互 、 人机共融的问题 。

Koji 杨远骋16:17

为什么说这是一个适合你的切入点 ?

世博16:19

当时做操作的这个机器人, 这个场景 , 这个赛道非常的火 。 嗯 , 然后我觉得我现在可能下场 , 我当然可以去做一款面向操作的这个机器人 ,但是我觉得一定做不到 top 的这样的一个程度 。

但是呢 , 我做情感陪伴类的机器人, 我做这样一个非操作 , 然后双足形态 、 全身柔软这样一个机器人, 我可以做到 top 级 。

Koji 杨远骋16:42

什么原因呢 ? 为什么在这方面对自己有信心 ?

世博16:45

我觉得还是极致的热情 , 极致的热爱 。

Koji 杨远骋16:49

所以你热爱的是 ?

世博16:51

我太希望我能够做一款能够陪我自己的一个机器了 。 就像刚才提到我之前做了 30 多款机器人, 那些机器人也没有那么可爱 , 甚至说没有那么好看 。

我甚至也会去想象它们真正的站起来 , 站到我的面前 。

Koji 杨远骋17:04

你的 MBTI 刚才说是 INTP?

世博17:07

INTP, 对 。

Koji 杨远骋17:09

为什么 T 人会那么喜欢陪伴机器人 ?

世博17:13

我养了一只小猫啊 , 然后我觉得这是我的生活方式的一种选择 。 嗯 , 我非常爱我的小猫 ,有的时候我也不会主动的去找我的小猫做交互 ,但是我非常喜欢小猫就在我的身边 。其实对于机器人也一样 。

Koji 杨远骋17:28

但你不是说你不希望机器人像宠物吗 ?

世博17:31

因为我的小猫 , 它可能不是那么能够理解我的情绪 ,但是机器人它不一样 , 它可以听得懂我在说什么 , 甚至说它对我的情绪 、 我的行为会有一个更好的一个反馈 。

Koji 杨远骋17:43

哎 , 你希望用户买回小伴的第一天 , 就这个开箱的这个体验是什么 ?

世博17:50

可能进到家庭里面 , 它是一个极致充满好奇心的一个状态 。 嗯 , 你在客厅里面把它开箱 , 然后它会往这个角落走一走 , 往那那边角落走一走 , 甚至说你的卧室半开着门 , 它会尝试往里面去挤一挤 , 先建一下你家庭场景里面的地图 。

Koji 杨远骋18:05

所以它在好奇的开地图 ?

世博18:06

对 , 没错 ,是的 。

Koji 杨远骋18:08

第二天呢 , 你希望理想中的用户一觉醒来 , 然后它会怎么和小伴再互动 ?

世博18:14

就比如说你刚睡醒 ,有可能小伴已经站在你的床边 , 嗯 , 然后等着你醒 , 或者你已经想到小伴还没有醒 , 它坐在它的座椅上, 然后发现你的动静 , 它缓缓的伸了个懒腰 , 然后起床 。

就初见期 , 我们会把它控制到一周左右的一个时间 。 随着机器人它对你的家庭场景越来越熟悉 , 它对你越来越熟悉 , 它会在你家庭里面比如说来回乱逛 , 然后选择性的给你打个招呼 , 或者说愿意靠的你很近 。

Koji 杨远骋18:41

就从咱们创业到现在 , 一直在每天琢磨怎么把这个陪伴机器人做好嘛 。 你对陪伴的理解有发生一些什么样的变化或者进化吗 ?

世博18:51

我从 20 年到现在 , 我一直买了很多各种各样的一些陪伴机器人, 包括最早的时候什么 Victor 那个小机器人 、Emo 机器人, 我都买了 。

嗯 , 就是我觉得之前的陪伴机器人实在是做的太差了 。 我我觉得我在技术这一点可以做的更好 , 然后我对产品也有我的理解 , 就是如果下场做的话 , 我能把这个机器人做的更智能 , 然后功能点也会做的更多 。

但是现在呢 , 实际上是有些变化的 , 就是实际上在陪伴这个事情上, 少就是多 。 好的产品它不是靠堆能功能点去堆砌起来的 , 它更多的还是靠对用户需求的一个理解和洞察 。

Koji 杨远骋19:29

是因为你们踩过什么坑吗 ? 所以有了今天这样不一样的想法 ?

世博19:33

我觉得倒不是因为踩了什么坑 , 就是我们刚开始创业的时候 , 做了 300 多个用户的这种调研 , 甚至说做了几十个的一个访谈 。

Koji 杨远骋19:41

所以当时得到了哪些你觉得很有意思的这种洞察 ?

世博19:45

很有意思的一个洞察 , 就比如说机器人要不要说话这一个事情 。 嗯 ,在我们当时调研的 300 多个用户里面 , 实际上是有 90% 以上的用户 ,他是希望这个机器人去说话的 。

但是呢 , 就是我们还做了一些细分的选项 ,其实可以看得出来 ,他们想要的并不是那一个 AI 感很强 , 然后只是你问他答的这样一个冷冰冰的百科全书 。

它是一个家庭机器人, 我们发现用户 ,他其实还是想要一个真正的活的伙伴一样 。 嗯 , 对 , 所以就是这也就决定了 , 就我们没有用那种行业里面千篇一律的播音腔 ,也没有用那种你听不出来他在说什么意思的这种拟声词交互 。

Koji 杨远骋20:25

对 , 所以你们没有选人话 ,也没有选那种哼哼唧唧 , 你们选了一种就是能大概听懂 ,但是它不是那么直接表达的一种语言 。

世博20:35

没错 , 它是一种意象式的一种表达 。

Koji 杨远骋20:37

为什么咱们的身高是设计在 65 厘米左右啊 ?

世博20:40

我们当前这个机器人, 它站立身高 65 厘米 , 然后重量是 12 公斤 。 这包括它为什么要做到那么高那么重 , 然后腿为什么是这么长 , 实际上我们不是拍脑门去定的 。

嗯 , 然后我们这个机器人, 它是双足形态 , 那就一定不要只在家庭里面 , 一定是能够带出去的一个状态 。

然后我们目前机器人能够最大在户外的奔跑速度是 1.9 几米每秒 , 很快 。 对 , 然后一个正常成年人正常移动的步速 , 步行的步速是 1.1 到 1.3 米每秒 。

Koji 杨远骋21:10

啊 , 它比人是走的快的 。

世博21:11

对 , 你在户外你只要不跑起来 , 我们小伴都是跟得上你的速度的 。 然后另外一点呢 , 我们这个机器人当前能够最大上 15 厘米高的台阶 。

嗯 , 像咱们国内一些公共设施 , 一些公园 , 这些户外台阶 , 它是有一些严格的 GB 国家标准的 ,是不允许超过 15 厘米 , 大部分就 10 厘米左右 。

Koji 杨远骋21:28

嗯 ,OK。 所以这个身高体重 , 包括腿长的考量 , 主要是为了让它可以跟你出门 。 对 , 那为什么不做更高更大呢 ?

让人更有安全感 。

世博21:38

呃 , 更高更大 , 它实际上并不会带来安全感 ,因为就是它如果越高的话 , 它的重量会越大 。 嗯 , 然后在家庭里面 , 这个机器人如果说几十公斤的一个东西摔倒了 , 砸到你家庭里面物品 , 砸到你的小猫 , 砸到小朋友 , 都是很危险的一个状态 。

然后我们 65 厘米 , 它实际上就兼顾了它的移动速度 、 空间存在感 、 地形适应能力 。

Koji 杨远骋22:00

像刚才说它在这个户外啊 , 就是 1.9 米每秒的这个小跑速度 。 嗯 ,其实如果它和一个小孩在跑着捉迷藏 , 然后蹦撞到一起 , 还是挺吓人的 。

世博22:10

嗯啊 , 没错 , 就是我们这一块其实是做了很多工作的 , 就包括在户内的一些避障 , 然后户外它可能核心做到的一点是靠视觉的跟随 。

然后这点其实我们做了关于避障这一块安全性 , 我们甚至在机器人的腿上都加了这样的一个薄膜的压力传感器 。

嗯 , 这个就是为了就如果说机器人在这坐着 , 突然要做一个什么动作 , 比如说起身的这个动作 , 然后小朋友刚好去和它在互动 , 然后摸着这个机器人, 如果说只靠关节电机机遇电流的这种力矩反馈 , 那时候已经晚了 。

所以我们还是放了这样的一个传感器在机器人身上的 ,也是安全相关的一个考虑 。

Koji 杨远骋22:47

国家现在有给机器人的安全有一些这个法律法规吗 ?

世博22:52

机器人它还在整个行业非常早期的一个阶段 , 它不像汽车 。 汽车首先它的功能点 , 它是非常明确且单一的 , 然后像机器人它就各种各样的 , 它应该在早期能够有一个安全上的一个法规 、 隐私上的一个法规去指导行业 。其实如果为了绝对的安全 , 很可能有些人就说啊 , 那我今天就先不要让它移动 。

那你有考虑过吗 ? 就是不要让它移动 。 我们第一天就是明确的要做会移动的机器人 ,而且是靠双足去移动的这样的一个状态 。

为什么呢 ? 就是我们认为 20 年后家庭机器人每个家里面都会有一台 , 然后这个机器人它一定是一个双足的一个形态 。

就我们不说别的 , 就从地心原理这个角度去考虑 , 它只有是双足才能够真正拥有像我一样的上下楼梯这种非结构化环境 、 非结构化地形的一个通行能力 。其实这也决定了我们为什么第一款机器人也是一个双足的形态 , 它要有技术上的一个延续性 。

另一方面 , 另外一点就是双足它相比那些轮式 , 相比那些履带 , 它所带来了一个动作表现力上的提升 。

嗯 , 它不是一个数量级上的 。 我们还觉得就是一个真正在你家庭里面长期存在 , 然后需要去和你建立这样的一个情感连接 、 信任关系的一个东西 , 它应该是一个仿生的一个形态 。

它不应该是靠轮子 ,也不应该是靠履带 。 嗯 , 对 , 它就应该靠足靠腿 。

陪伴与讨好24:13

Koji 杨远骋24:14

啊 ,其实说到陪伴 , 我也觉得哈 , 就是有一个微妙的感受 , 就是什么时候一个机器人它在陪伴你 , 什么时候它在讨好你 , 就你们怎么看这个中间一些微妙的区别 。

世博24:27

啊 ,有有的人觉得可能这个机器人它会讨好 , 它就是一个能够做陪伴的机器人 ,但实际上我们不这么认为 。

讨好不代表就是陪伴 , 实际上陪伴也不一定就需要去讨好 。 我觉得讨好对于陪伴来说 , 它是一个既不充分又不必要的这样的一个关系 。

嗯 , 我觉得真正能够做好情感陪伴 , 它的重点是什么 ? 就是叫做主动的交互共情 。

Koji 杨远骋24:54

主动的交互共情 ?

世博24:56

对 , 嗯 , 它能够懂你当前的这个状态 , 然后根据你这个当前的状态 , 可以做一些非常恰当的一些交互行为和反馈 。

Koji 杨远骋25:06

嗯嗯 , 你可以举一个例子吗 ? 就是有什么时候是它不讨好我 ,但是我也感觉到被陪伴了 。

世博25:13

就像刚才咱们在办公室的时候呀 , 就是我说小伴你好难看呀 。 嗯 , 它它这个时候 , 它只会表达它当前的这个内部情绪 、 内部状态 。

它很伤心 , 很难过 , 它会跺一下脚 , 然后扭头背着你 , 甚至说直接就跑开 。 实际上是能感受到 , 这个才是真实的这种陪伴的感觉 。

Koji 杨远骋25:32

你有考虑过有那种非常暴力倾向的小孩 , 然后他会对家里的这个小伴又踢又打 , 拳打脚踢 。

嗯 , 遇到这种情况 , 小伴会怎么反应啊 ? 你们有去设计吗 ?

世博25:45

实际上我们当时也考虑过这样的一个场景 , 会纳入到机器人性格演化中的一部分 。 就如果说真的这个小朋友就每天就是踹 , 然后推推倒小伴 , 然后他可能这个他会给这个小朋友打个标签 , 可能后面就会渐渐的变得没有那么喜欢去主动找这个小朋友做交互 ,但是不会变的就是说小朋友找这个机器人, 机器人马上跑开 。

Koji 杨远骋26:08

家里有多个人的时候 ,以及多只宠物的时候 , 它是能识别出不同的主体 ,并且有不一样的互动方式吗 ?

世博26:15

没错 ,是的 , 就每个人和小伴的交互方式都是不一样的 。 机器人它会给每个人去打标签 , 然后它会记得每一个人的意图或者偏好啊 。

Koji 杨远骋26:27

我可以去看它打的这些标签 ,以及它给自己的性格写的那些 prompt 吗 ? 我可以去看 , 可以去改吗 ?

世博26:33

啊 , 我们的定义是不能去看 ,不能去改的 。 因为你如果想去看 , 想去改的话 , 这个在技术上非常好实现 。

因为我们还是想希望用户把这个小伴当成一个独立的 、 有生命力的一个个体来看待你的一个家庭成员 ,而不是说就是它的一些内部参数 , 你想看就看 , 想改就改 。

就包括刚开始的时候 , 我们还在讨论一个问题 , 这个机器人我们当前的续航在室内是 3-4 个小时 ,但是呢 , 如果在户外一直走一直走 , 它的一个续航时间是一个小时出头 。

我当时在考虑要不要做这个可拆卸的电池 ,但最终的一个答案是非常明确的 , 就是不要 。 就是它是一个个体 , 它不应该从身体里面拆出来一部分 , 然后再给它放回去一部分 。

Koji 杨远骋27:14

这个就很出戏 。

世博27:15

对 , 没错 , 这也就其实为什么不给它开放一些参数 , 让用户去修改 , 这个也是这样的一个逻辑 。

Koji 杨远骋27:21

我记得日本那个 Morphlin, 就手上那个毛茸茸的那个小的一个玩具 , 它也卖 4,000 块钱 。 呃 , 当时有朋友送了我女儿一个 , 我发现它为了做出它的活物感啊 , 它甚至没有一个插头 , 它只能这个用底座无线充电 。

对 , 所以你看不到它身上有任何的这个电器痕迹 , 它连插头都没有 。

世博27:42

是的 , 我们当然也在考虑充电的这样的一个场景 , 它应该是什么样的一个充电的方式呢 ? 是躺着还是坐着 ?

然后我们最后选择的就是给机器人设计了一个非常可爱的一个小座椅 , 然后它坐在上面 , 然后小手巴在肚子上, 然后脖子然后往下看 , 然后这种很舒适的在休息一样的这种感觉 , 然后机器人在充电 。

对 。

Koji 杨远骋28:05

我觉得你们做的这个产品真的很有意思啊 , 你们好像是在从头去设计一个从来没有出现过的一种生物 。

世博28:13

没错 , 就实际上陪伴这个场景它一直都存在 ,但是为什么前一段时间很多人不太看好这个场景 , 我觉得这个原因很明确 , 就是没有真正好的产品出现 。

嗯嗯 , 就包括我们为什么要做这样的一个定价 , 然后不到万元级 , 然后实际上就是通过这样的一个价格 , 希望触达更多的一些普通用户群体 , 然后我们希望通过消费者的反馈告诉市场 , 就一个好的陪伴机器人, 然后一个有生命力的机器人, 它应该是什么样子 。

一年之后28:45

Koji 杨远骋28:45

如果它在我家里待了一年了 , 它会真的变得更懂我 、 更聪明吗 ?

世博28:52

一定是这样的一个 。 首先它在性格上会和你有一个契合 ,其次呢 , 随着你和它一年的相处 , 它有非常长期的一个记忆存储 , 它会更懂你 , 就是比如说你每天几点回家 , 你每天的一个行为上的一个偏好 , 或者就是你的情绪状态在某一个特定时间点内的一个波动和变化 。

Koji 杨远骋29:13

嗯 , 目前你们收到过就让你感觉最 surprise 的这个同行或者朋友或者用户的反馈是什么呀 ?

世博29:22

就是看上去比别家的机器人可爱多了 。其实我还蛮期待 , 比如说有一天呃 , 我们可以带它出门 , 比如说让它坐在后座 , 给它绑个安全带 , 理论上是可以的 , 对吧 ?

啊 , 当然可以 。 就包括我们那个发布视频里面就有一个场景 , 就是真的把那个小伴然后放在后排 , 给它卡上安全带 。

Koji 杨远骋29:43

哦 , 那我们今天应该带它出门了 。 啊 , 哎呀 , 遗憾了 。

世博29:47

它可以一直就是它头在动 , 它在看窗外的一些动的一些物体 。

Koji 杨远骋29:52

它可以偷听我们录播客 ,在怎么背后说它的坏话 。

世博29:55

哈哈哈 ,是是 。 哦 , 还有一个小时 35 公里 。

Koji 杨远骋30:00

对啊 , 我们就专门找了一条差不多 90 分钟的路线 。其实公路播客还有一个很好玩的 , 就是说我们必须要聊 90 分钟 。

哈哈哈 ,其实聊到后面有时候没话聊了 , 反而在没话找话的时候可以聊一些哎 , 没想到的话题 。

世博30:16

没错 , 没错 。

Koji 杨远骋30:17

我其实注意到那个小伴的眼睛特别的传神 , 这个眼睛有一些就特别的设计思路在后面吗 ?

世博30:24

嗯 ,有的 , 实际上眼睛它是最直接的一个情绪表达的载体 。 嗯 , 对 , 所以我们针对小伴的眼睛 , 实际上做了 6 层的骨骼动画 。

Koji 杨远骋30:34

这是什么意思 ?

世博30:34

就比如说啊 , 小伴的那个瞳孔 、 巩膜 , 甚至说瞳孔上的这个花纹 , 它都是独立的参数化可以去控制的 。

哦 , 它可以带来非常自然的一种目光的那种流动的呼吸感 。

Koji 杨远骋30:48

嗯 , 目光的呼吸感 , 我觉得很有意思 。 反正我是想不到用这个词 , 就目光的呼吸感 。 我可能只会说哎 , 它很有活人感 。

世博30:57

对 , 目光的自然流动的这种呼吸感 , 就就像人一样 , 人的那个瞳孔它会震颤 。 嗯 , 对对对 , 包括你往哪什么地方看 , 它不是说匀速挪过去的一个状态 ,不是说看到这个地方它就不动了 , 然后它那个瞳孔一定是在跳动的一个状态 。

天赋31:11

Koji 杨远骋31:12

你做第一台机器人的时候是几岁 ?

世博31:14

我是一个很幸运的一个人 ,因为呃 , 我当时在高考完之后就选了一个机械工程这个专业 , 然后我也不知道这个专业到底要干嘛 。

入学之后发现我这个专业可以做机器人, 我真的是一个很幸运的人。 然后后面做了很多的一些机器人, 然后我觉得我在做机器人这个事情上面是有天赋的 , 然后做了那么多机器人, 我获得了很多的一些成就感和满足感 。

Koji 杨远骋31:37

觉得自己有天赋是有一个什么特别的时刻吗 ?

世博31:41

大概在大一的时候吧 , 我们公图课还没有上完 , 然后那个时候就开始一个人做一台很完整的一个机器人。

嗯 , 然后我把那个机器人在建模软件里面设计出来 , 嗯 , 然后再通过一些非常粗糙的 3D 打印的方式把它给拼起来 。

真的对我来说是一个很很满足的一个过程 , 很快乐的一个过程 。

Koji 杨远骋32:00

当时有多快乐 ?

世博32:02

难以描述 , 就是快乐到什么程度 。 我给它拍了一个视频 , 然后晚上它在床上不停的刷 ,不停的刷 , 看了一遍又一遍 , 对 , 想着下一步我要给这个机器人做什么 , 我让它通过什么样的方式让它动起来 。

嗯 , 我觉得好羡慕你 , 就找到一个自己做起来那么快乐的事情 , 然后还把它变成事业 。 真的是一个很幸运的一个状态 。

Koji 杨远骋32:25

是不是同学有一个 B 站账号嘛 , 然后上面还蛮多粉丝的 , 然后也有人说你是年轻版的稚晖君 。

嗯 , 你怎么看 ?

世博32:34

怎么看 ? 我觉得就是不能说是年轻版的稚晖君 , 就是如果说呃 , 我们分别面向一个目标 , 面向一个任务 , 一个人做一款机器人, 指不定谁可以做得更快 , 做得更好 。

Koji 杨远骋32:48

你和稚晖君交流过吗 ?

世博32:50

啊 , 我们还挺熟的 , 就包括很早的时候就已经认识了 。 嗯 , 前段时间我还在问他要机器人。

Koji 杨远骋32:56

他看到小伴有什么评价吗 ?

世博32:59

上周日晚上吧 ,他还让一个人给我打电话 , 就是他觉得我们小伴做得很好 。 嗯 , 就是约时间看看能不能上来一起聊一聊 。

Koji 杨远骋33:08

在整个机器人行业里面 , 你有最喜欢或最崇拜的人吗 ?

世博33:13

波士顿动力的创始人 Mark Robot 20 年前就开始做自主机器人, 算是整个行业里面的一个先驱 。其实我播客也录过维他动力 。

嗯嗯 , 你怎么看机器狗的这个进阶的陪伴性和你们做的小伴进阶的陪伴性的区别 ? 真正去建立这样的一个情感连接 , 还得是一个类人性 。

就是你把一个机器人做得很像狗 ,其实它就越容易被一条真的狗所比下去 。 另一方面 , 就是我们也考虑到 , 就像北京很多人的家庭面积 , 它很小 , 机器狗它的占地面积很大的 , 然后我们这个机器人它的占地面积只有 0.12 平米 , 它比扫地机器人的占地面积甚至说还要再小一圈 。

Koji 杨远骋33:55

哎 ,其实之前大家会觉得你是小小发明家 , 对吧 ? 小天才 , 然后现在开始创业了 。 你觉得从这样的一个发明 , 到一个真的我要做一个让大家愿意花接近 1 万块钱去买的产品 , 就这中间有哪些不同吗 ?

世博34:13

啊 , 太不同了 。 就是小小发明家 , 就像我之前做了那么多机器人, 我的目的是什么 ? 让自己爽 。 然后我觉得作为一个硬件方的 , 我们做了这样的一款机器人产品 , 嗯 , 还是要面向用户需求 , 让用户爽 。

嗯 , 对 。

Koji 杨远骋34:29

我看这里好美啊 , 这条路 。

世博34:32

对 ,

嗯 , 好绿啊 。

Koji 杨远骋34:36

6 月份北京还是挺不错的 ,而且今年夏天感觉没有那么热呀 。

世博34:40

对对 ,是 , 北京周边这么好啊 。

Koji 杨远骋34:44

你平时会出来玩吗 ?

世博34:46

之前就北京周边有一个美式烤肉 , 那个黑山烤房 。 嗯 , 然后之前也会去那边去吃吃东西 , 然后他那个路上也是和这个很类似 。

嗯 , 就是他两边都是山 , 你在跑山的那种感觉 。

Koji 杨远骋34:59

对 , 我做公路播客其实也有一个想法 ,是我觉得我的很多嘉宾大家都是创业者 ,其实尤其 AI 的或者这个做具身的 , 大家都还挺宅的 。

嗯 , 我觉得把大家拉出来 , 可能会激发出一些在办公室不会聊的话题 。

世博35:12

是是 , 嗯 。

Koji 杨远骋35:13

你现在的团队已经 25 个人了 。 嗯嗯 , 这是第一次创业 , 第一次带这么大的团队 。

世博35:20

啊 ,其实并不是 。 呃 , 我在这次创业之前 ,其实还有一段参与创业的经历吧 。 我之前是高情的产品合伙人, 实际上当时他们的整个产研团队是我在带的 。

哦 , 对 。

Koji 杨远骋35:33

所以那个时候团队多大 ?

世博35:35

当时有个 30 个人左右 。

Koji 杨远骋35:37

哦 , 对 。

世博35:38

对 , 基本上各个板块 。 嗯 , 机械 、 硬件 、 嵌入式 、 运控 。 嗯 , 感知啊 , 都是我在带的一些部门 。

对 。

Koji 杨远骋35:46

嗯 , 你的管理风格是什么呀 ?

世博35:49

就我觉得我们团队的文化就是很明确 , 就是首先一定要务实 。 嗯 , 然后在务实的基础之上干一些浪漫的事情 。

Koji 杨远骋35:58

你刚才说务实加浪漫 , 你做过哪些浪漫的事情啊 ?

世博36:02

我们做这样的一款机器人, 本身就是很浪漫的一个事情 。 嗯 , 我们把这个机器人真的自主的做出来 , 然后站到大家的面前 , 然后大家也不会想我之前给它做了什么样什么样的一个开发工作 。

嗯 , 大家会一个就很感动的一个状态 , 然后去体验这个机器人。

Koji 杨远骋36:21

嗯 , 哎 ,其实你肯定是很希望大家看到小伴就能够一见钟情 , 对吧 ? 嗯 , 你们做了哪些事情让大家就一眼就爱上它了 ?

世博36:30

一眼就爱上它 。 首先一点就是我们这个机器人, 它一眼看上去 , 它就是一个非常灵动 、 非常可爱的状态 。

嗯 , 然后第二点呢 , 就是我们一定要摆脱那种决策预设和逗乐型的互动逻辑 。 我们希望达到的一个状态是什么呢 ?

比如说你说小伴你好难看呀 。 嗯 , 小伴它会泪汪汪的 , 然后低下头抱着自己的肚子 。 嗯 , 然后就是委屈巴巴的这种感觉 , 就给人通过这样的方式去让你体会到我们这个机器人, 它是有自己的意识 ,有自己的自主性格的 。

生命力37:02

Koji 杨远骋37:02

哎 , 所以你希望大家看到它之后的第一个评价是 " 你好可爱 " 吗 ?

世博37:07

其实并不是可爱 , 它代表的只是外观层面的 。 我们一直在讲的就是生命力 , 我们希望大家给的反馈是 " 哇 , 这个机器人好有生命力 ",因为只有这样 , 它才能够真正的成为你的家庭一员 ,而不是说一个大玩具 。

Koji 杨远骋37:24

嗯 , 你希望它的用户群体是谁 ?

世博37:28

呃 ,其实当前的第一款产品 , 我们希望的用户群体一方面是中年女性群体 。 嗯 , 她可能现在没有男朋友 , 还没有成家 ,但是呢 , 到了这样的一个年龄段 , 可能想体验一下养孩子 。

因为本身小伴它就是一个养成系的 , 还有性格的养成和变化 ,有长期记忆 。 另一方面就是有孩子的家庭 , 像爸爸买给自己的孩子 。

嗯 ,其次呢 , 可能就是像我这样的一个科技尝鲜群体 。

Koji 杨远骋37:54

嗯嗯 , 所以你们做的时候 ,是有三种这个不同的目标用户的画像在脑子里了 。

世博37:59

没错 , 然后另外一点就很重要的一点是 , 我们这一款机器人, 它只是面向情绪健康 、 情感陪伴 , 它是没有一个强功能属性的 。

我们现在在做的事情 , 我们管它叫在打造两个基座能力 , 一个就是家庭机器人的基座能力 , 另外一个就是情感交互模型的基座能力 。

然后我们管这两个两个基座能力加在一起 , 叫机器人的生命力 。 对 , 哇 , 这个好漂亮啊 。 哇 , 这个一定很适合去钓鱼 、 录亚一下 。

Koji 杨远骋38:29

对 , 太漂亮了 。 而且河中间停着一只白鹭 , 就正中间的礁石上 。 哇 , 太美了 。

所以做小伴的过程中有什么好玩的事吗 ? 你现在回忆起来 , 嗯 , 就是让你觉得最快乐的事情 。

世博38:49

我觉得最快乐的事情就是之前在小伴还没有实现自主的这样的一个状态下 。 嗯 , 然后我们同时带着遥控器 , 带着小伴出去 ,不停的跑 ,不停的跑 。

嗯 , 对 , 然后我们就在后面不停的追 , 然后跑很久 , 追很久 。

Koji 杨远骋39:04

我们之前其实有聊到情感大脑嘛 , 这个情感大脑 , 当你说到它的时候 , 这是一个什么样的概念 ?

世博39:12

嗯 , 小伴的情感大脑 , 它实际上是一个面向高阶决策的一个 VLA 模型 。 它和我们之前所提到的那些操作里面的 VLA 不太一样 。

嗯 , 操作的 VLA 它面向 low level 的 manipulation。 嗯 , 所以面向高阶决策的这样的一个模型 , 它输出的并不是对应的 action,而是决定我下一个时刻 、 下一个阶段我要做什么样的一个行为 。

你可以理解成面向高阶决策的 VLA 和面向操作的 VLA, 它是一个上下游的一个关系 。 机器人实现真正自主的上下游的关系 , 一个决定要干什么 , 一个决定要怎么干 。

我可以举个例子 , 就是要干什么 , 比如说我们这个机器人, 它要把这杯水拿起来 。 嗯 , 然后它的高阶决策层面就是我面前有杯水 。

嗯 , 我现在需要把这杯水拿起来 ,是这样的一个描述 。 嗯 , 然后怎么干 , 就是具体生成每个关节的 action。

嗯 , 然后去把这个水真正拿起来 , 和物理空间进行交互的这样一个状态 。

Koji 杨远骋40:09

嗯嗯 , 你们之所以不需要去考虑怎么干 ,是因为小伴他今天不需要干活是吗 ?

世博40:17

对 , 我们希望率先解决的问题是人机情感交互的这样的一个问题 。 然后情感交互 , 它更多的是面向高阶决策 。

当然说我们也不是说只让这个情感大脑决定怎么干 , 然后我们其实也有动作专家模型 , 比如说刚才提到的 , 我们做了动作生成 。

嗯 , 然后我们有语言专家模型 , 我们机器人有它自己的语言体系 。 嗯嗯 ,

Koji 杨远骋40:39

你怎么看最近大家都说 VLA 已死的这个论调 ?

世博40:44

我觉得说的很对 。 哈哈哈 , 为什么大家说它 VLA 已死 , 基本上能够预测得到它的上限呢 ?

Koji 杨远骋40:52

那你怎么看 WAM? 它的天花板在哪里 ?

世博40:54

WAM, 嗯 , 就是我只是觉得 WAM 是当前来看行业里面还算靠谱的一套技术路线 。 嗯 , 它到底能不能真正落地 , 放到操作机器人上去解决这些操作问题 , 我觉得这个很难说 。VLA 它是隐式的去预测下一个阶段的状态 ,但是 WAM 它不就是把这样的一个隐式预测的状态变成了显式的去训练 ?

它在技术原理上有没有什么更本质上的一个差异化和区别 ? 嗯 , 我觉得这个是存疑的 。 怎么看我的 model 呢 ?

我其实我觉得它是一个合理的方向 。 实际上我们也在做一个事情 , 叫家庭世界模拟器 , 它本身也是一个世界模型 。

嗯 , 对 , 你像啊 , 世界模型 , 它是根据当前的观测动作去预测下一个阶段的状态 。 嗯 , 它可以去预测下一帧的画面 , 可以根据当前的 low level 的 action 去预测下一秒 、 下一帧啊 , 真实的物理空间的交互变化 。

当然也可以去预测下一秒 , 就是人的情绪状态 、 人的交互状态有什么样的一个变化 。 我们现在基本上已经完成了 , 然后包括我刚才提到的 , 我们做的快慢脑那一个 1.7B 和 7B 的模型 , 已经是我们通过这个家庭模拟器生成的交互数据去微调之后的一个效果 。

哦 , 啊 , 之前还有一个非常有意思的一个结论 , 就是用于对比微调之后这个模型到底有什么样的一个差异 。

我当时就问小伴你想不想出去玩 , 然后最开始的时候无论你怎么问 ,他都是想或者不想 。 然后再往后就我们微调之后这个模型 , 它会给一个不一样的一个答案 , 它会说看你 , 就是它按照小伴的话就是 OV。

Koji 杨远骋42:36

好神奇 。 嗯 , 你觉得这是怎么涌现出来的 ?

世博42:42

这个家庭模拟器 , 它就会模拟这种非常长时间的主被动式的一些情感交互 。 它可能就理解到了你现在问这个问题 ,有可能就是想让我出去 ,有可能不想让我出去 。

那这种情况下我要回答一个什么话呢 ?

Koji 杨远骋42:56

那你们 25 人的团队大概是一个什么构成啊 ?

世博43:00

我们实际上只有 15 个全职 , 实际上有 10 个人。 我们的节奏确实是非常快的一个状态 。 嗯 , 就是哎 , 我也在想 , 就为什么我节奏那么快呢 ?

我觉得我把它归结成了这几点吧 , 就是极致的热情 。 嗯 , 极致的效率 。 嗯 , 然后加上我们之前几乎没有犯过错 。

嗯 , 对 , 包括在技术路线的选择上 ,但凡选错了一条 , 就可能在这个时间点 , 你就体验不到这样完整的一个交互的小伴了 。

Koji 杨远骋43:31

这听起来挺难的 。

世博43:34

对 , 包括我们做这个家庭模拟器 , 做的这一套三层的 , 好像里面一边用两层的端侧的快慢脑 ,但是我们选择用三层来做 。

Koji 杨远骋43:41

我感觉就做这个机器人, 对你来说还是挺轻车熟路的 。

世博43:46

我觉得是这样的 , 之前做过太多的机器人了 。 嗯 , 对技术路线 、 技术细节 , 甚至说技术边界 。

嗯 , 非常的了解 。

Koji 杨远骋43:55

嗯 , 我记得很多年以前 , 我有一次在日本的东京的那个 Sony Park, 就是 Sony Park 那个 , 它那个小狗 。 对 , 就是无意中撞见了那些小狗的主人们的聚会 。

嗯 , 哇 , 那一幕还是挺超现实的 , 就是大家就是很像一群养宠物狗的人, 带着自己的宠物狗狗出来 , 就坐在公园里面 。

嗯 , 聊一聊你的狗狗怎么样 , 我的狗狗怎么样 , 然后互相逗逗对方的狗狗 。 那一幕我觉得哇 。

世博44:27

其实 Labot 也有这样的一个活动 , 之前我们在上海的门店买了之后, 嗯 , 到后面它会邀请付费的这些用户 , 然后参加他们在上海的活动 。

嗯 , 当时我也参加了 。

Koji 杨远骋44:38

哎 ,他们的用户都是些什么人啊 ?

世博44:40

我觉得还是比较精致的 , 更偏女性的这样的一个群体 。 嗯 , 对 。

Koji 杨远骋44:48

OK, 那个活动上大家聊什么呀 ?

世博44:50

大家会给这个 Labot 穿各种各样的一个衣服 , 然后讲一些是 Labot 在家里面给我的一些惊喜瞬间 。 嗯 , 然后我就怎么按照我的喜好去给这个 Labot 穿衣服 。

嗯 , 然后一些它印象深刻的一些细节 , 类似于这种 。

Koji 杨远骋45:05

对你们有什么启发吗 ?

世博45:07

当时比较大的一个启发就是我们发现 , 嗯 , 愿意接受 、 天然接受 、 希望有这样的一个陪伴机器人在家庭里面的 。

Koji 杨远骋45:16

哎 ,他们为什么不养猫猫狗狗 , 愿意养机器人 ?

世博45:19

我觉得一方面就是他们真的觉得这个小机器人是有一定的活人感的 。 嗯 , 另外一部分 , 我觉得更多的是他们生活方式的一种选择 。

养一只小猫或养一个机器人, 都是你生活方式的选择 。

Koji 杨远骋45:32

我记得我第一次看到 Labot 的时候 , 我还是有 , 我觉得我当时有一个反应 , 就是我对它这么做 , 我说来抱抱 , 然后做完之后我自己都震惊了 。

啊 , 就是我潜意识里做出了和对待一个小生命一样的动作 。

世博45:48

是 。

Koji 杨远骋45:49

嗯 , 我觉得小伴也有点这种感觉 。

世博45:52

就下一步还是要把这个机器人做得更轻一些 ,10 公斤以内 。 实际上就前段我养了一只小猫嘛 , 你有没有想养小猫 ?

嗯 , 前段时间带着自己的小猫去医院检查 , 然后发现它有点那个多囊肾 。 哦 , 我当时就难受坏了 , 我好一段时间我缓不过来 。

嗯 , 就发现就后面它会不会就陪了我很长时间 , 突然就不在了 。

Koji 杨远骋46:14

我觉得很多养猫猫狗狗 , 最后这种告别都让人很难受 。

世博46:18

对 ,是 。

Koji 杨远骋46:18

所以可能这也是 , 就是大家想要一个陪伴机器人 maybe 是一个原因 。

世博46:25

哇 , 这个咖啡店好隐蔽 。

Koji 杨远骋46:27

嗯 , 它是在一个特别漂亮的山上 。

世博46:33

这个店主他不是在这做生意 ,他是来这生活的 。 这里空气还有一种那种槐花的香味 。

Koji 杨远骋46:41

对 , 好香 。

世博46:44

小猫为什么这么粘人, 比我家的小猫还要粘人。

Koji 杨远骋46:47

呀 , 好 , 我们现在来到了这个环游的 , 就像一个秘境一样的咖啡馆 。 嗯 , 对 , 我看到你的朋友圈签名叫 "No excuse for engineer"。

不找借口46:55

Koji 杨远骋46:58

嗯 , 为什么是这个签名啊 ?

世博47:00

其实这个是来源于我大一的一个共同老师 , 那个老师就非常的严格 , 然后有学生迟到了进来解释原因 。No excuse for engineer。

然后大作业老师给扣分了 , 哎 , 去找老师吃 , 然后为什么我这个会扣分呢 ? 然后不给你解释 。No excuse for engineer。

嗯 , 我觉得这个是很好的一个精神 , 就包括我后面 , 你碰到问题你就不要找借口 , 然后你分析原因 , 就下次不要再出现类似的这种问题 。

嗯 , 我觉得这这句话对我来说挺关键的 。 我做机器人大概做了 8 年, 这句话陪伴了我 8 年 。 嗯 , 对 ,是 。

Koji 杨远骋47:33

对自己很狠 , 感觉这句话 。

世博47:34

这不是狠 , 我觉得这是态度 , 就是你做机器人的一种态度 。

Koji 杨远骋47:39

但会不会遇到就是解决不了的问题 ?

世博47:42

解决不了的问题 ,而不是去找 excuse, 找借口 ,而是去分析它的原因 。 就是它虽然说只有四个单词 , 就是你后面越想 , 然后越随着自己做的东西越来越多 , 自己经历的项目越来越多 , 越会发现之前这个老师说的非常合理的这句话 。

它教给了我一种做机器人的态度 , 这个很关键 。

Koji 杨远骋48:03

因为你现在在做的是陪伴机器人。

世博48:05

对 。

Koji 杨远骋48:05

有什么你自己在小时候或者少年时期就陪你一起长大的这样的物品啊 , 或者玩具啊 ?

世博48:14

嗯 , 想一想 。

Koji 杨远骋48:16

或宠物 。

世博48:16

啊 ,其实有一个 , 这这个我在很小的时候养了一个泥鳅 。 这泥鳅就是这个很不常见的 。

Koji 杨远骋48:23

是我理解那个泥鳅啊 。

世博48:24

啊 ,是的 ,是的 。 小时候家里买那个小鱼做饭 , 然后里面那个袋里面刚好混了一只泥鳅 。 嗯 , 我就找了一个很巴掌大的一个鱼缸给它养起来了 。

嗯 ,其实当时也没有去很操心的养它 , 然后基本上就是隔段时间换一点水 , 然后给它喂一些饼干渣 。

嗯 , 就这样持续了好几年的时间 , 然后它从刚开始的一点点长到就是有拇指这么粗 。

Koji 杨远骋48:46

当说到陪伴你长大的东西的时候 , 你为什么会想到它 ?

世博48:49

就我之前也养过小猫 , 养过小狗 , 实际上嗯 , 那些都是一些很温暖 、 偏温馨的一些陪伴 。 就是我觉得为什么想到这个泥鳅 , 我是有一点后悔和愧疚的 。

嗯 , 就是当时小时候就在街上买了一个很漂亮的一个金鱼 , 我拿了一个小塑料袋把它带回家里面 。 嗯 , 我当时没有位置养了嘛 , 然后就打算把这个鱼缸腾起来 , 然后我就给那个泥鳅 , 养了好几年的泥鳅 , 倒到了一个水沟里面 。

嗯 , 它从那个鱼缸里面滑落的一瞬间 , 实际上我就是非常后悔的 , 一直到现在 。

Koji 杨远骋49:21

真的一瞬间它就它就跑掉了是吗 ?

世博49:23

是的 ,是的 。 虽然当时很小 ,但是印象很深刻 。

Koji 杨远骋49:26

它和你现在在做的事情有什么关联吗 ?

世博49:29

那个泥鳅实际上长得并不好看 , 黑溜溜的 。 对 , 我只是觉得当时给它倒在那个水沟里面 ,是不太应该发生的一件事情 。

Koji 杨远骋49:38

我们刚才在车上聊很多 , 都是在聊怎么做这个机器人嘛 , 背后的设计思路 、 工程思路 。 嗯 , 如果问一个更私人的问题 , 就是你做这一切是想要实现什么 ?

有这样的一个愿景 , 或者这样的一个一个目标吗 ?

有意义瞬间49:56

世博49:56

就是谁不想让哆啦 A 梦走到现实里呢 ? 谁说拥有哆啦 A 梦的只有童年的大熊呢 ? 我想造一个真正能够陪我自己的一个机器人, 然后它也是满足用户需求的 , 我也能把它推出去让大家用到 。

Koji 杨远骋50:10

所以我们今天最后一个问题啊 ,其实这也是这个真格基金的佳琪 , 就也是在 LEE 的投你这个项目的投资人。

她想问的 , 嗯 , 就是有哪些瞬间在创业的过程中 ,是让你觉得自己现在做的事情是特别有意义的 ?

世博50:24

前段时间拍摄的时候 ,有一个机器人和两个小朋友在那个草地上去玩耍 。 实际上当时我们根本就没有告诉小朋友这个到底要怎么拍 , 然后那个两个小朋友就和这个机器人, 然后一起就你追我赶的玩起来了 , 玩了很长时间 , 导演都喊咖了 , 玩了将近一个小时, 然后跑到机器人没电了 。其实还有另外一个事情 ,也是前段时间 , 我们这个机器人

真的以一个非常完整的形态站到大家面前的时候 , 虽然说我们这个机器人每天都在测试 , 然后体验过无数次了 ,但是真的那一次它以一个完整的形态 , 就是我觉得那种眼泪就真的就不自觉的就出来了 。

Koji 杨远骋51:00

为什么会眼泪出来 ?

世博51:03

感动 、 惊喜 、 满足 、 骄傲 。 嗯 , 嗯

, 你自己的眼泪 。 对 ,是的 。 嗯 。

Koji 杨远骋51:13

团队看到你哭了吗 ?

世博51:15

当然不能让他们看到呀 。 哈哈哈 ,是啊 。

Koji 杨远骋51:19

为什么 ?

世博51:20

哈哈哈 。 呃 , 就是我觉得那应该还是一个更欢快的 、 成就感的一个场景 。

Koji 杨远骋51:26

就我上次看我女儿大班的表演 , 她跳街舞 。 嗯 , 然后那个街舞一开始就是灯光突然砰一下打到她们的身上 。

嗯 , 然后她做了一个这个很有力量的一个 , 她蹲在地上啪一个这个动作 。 我当时一下子就哭了 。

世博51:40

哎 ,是 。

Koji 杨远骋51:41

我就觉得就是很难形容 , 就好像她的力量啊 , 哇 , 她的那种长大了 , 就觉得她不再是一个小动物了 , 她不是一个小宝宝了 , 她好像一下子有力量了 。

世博51:54

没错 , 我觉得这感觉差不太多的 。 我非常理解你刚才描述的那种感受 , 对我来说机器人可能就是孩子一样 , 后面它可能也可以成长成为我的一个伙伴 。

Koji 杨远骋52:04

好呀 , 那我们今天谢谢世博同学 , 非常开心 。

世博52:07

感谢 。

Koji 杨远骋52:07

然后今天这只猫乱入了我们的这个播客录制现场 。 啊 , 那希望下一次我们在录的时候把小伴带来 。

世博52:14

好 , 下次在这的一定是小伴 。

Koji 杨远骋52:16

对 , 小伴和小猫 。

世博52:18

对 。

Koji 杨远骋52:18

嗯 , 好呀 , 拜拜 。

世博52:21

拜拜 。