十字十字路口Crossing2025年9月29日· 1:18:52

拜托了,AI!帮忙解决「看病难、看病贵」吧|对谈王国鑫:京东健康探索研究院首席科学家

本集邀请京东健康首席科学家王国鑫,深入解析医疗大模型「京医千询2.0」和「AI医院」的研发与应用。他阐述了AI如何通过提升供给、降低成本和连接后端供应链来解决「看病难、看病贵」的核心痛点,并分享了医疗数据采集、合成数据验证以及垂直模型与通用模型的差异化优势。同时,他对比了中美AI+医疗的商业路径差异,强调专业性与共情能力的平衡,为其他垂直行业的大模型落地提供了可迁移的经验。

  1. 0:00开场
  2. 1:49快问快答
  3. 2:42医疗痛点
  4. 7:57数据困境
  5. 12:10垂类判断
  6. 25:29模型进化
  7. 34:07对比GPT
  8. 47:59数据获取
  9. 55:17AI医院
  10. 1:08:03全球视野
  11. 1:12:07健康建议
  12. 1:15:45经验投资

转录文稿

开场0:00

王国鑫0:03

欢迎收听 《 十字路口 》, 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会 。《 十字路口 》 是乔布斯对苹果公司的一个比喻 , 形容它站在科技与人文的十字路口 , 伟大的产品往往诞生在这里 。AI 正在给各行各业带来改变 , 我们寻找 、 访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者 , 和他们一起探索和拥抱新变化 、 新的可能

性 。

我是 《 十字路口 》 的 Koji, 联合创办了街旁 、 新世相和躺岛 , 发起了 AI Hacker House 这个新一代 AI 创业者的社群空间 。

我相信科技 , 尤其是 AI,是我们这一代人最大的价值创造机遇 。 欢迎大家找我聊天 , 碰撞想法 , 链接下一个可能性 。

Ronghui0:53

我是 《 十字路口 》 的 Ronghui,在美元 VC 工作过 ,也做过 5 年的硅谷驻站记者 , 关注科技发展和商业故事 ,也欢迎大家找我聊天和我交流 。

Koji 杨远骋1:05

大家好 , 欢迎来到这期的 《 十字路口 》。 这期的 《 十字路口 》 呢 , 我们邀请的是京东健康的首席科学家王国鑫老师 , 来聊一聊医疗大模型 。

这个医疗大模型 , 它是一个挺典型 ,也是一个挺特别的一个案例哈 , 然后我们想要通过它来聊一聊 , 看看是不是所有的垂直场景的 AI 创业都会遇到类似的这样的问题 , 就是数据从哪里来 , 怎么来验证 , 这个商业落地怎么来实现 。

这次其实也是我们第一次在节目里面邀请到一个公司的 C-level 的一个首席科学家哈 , 我就直接叫 Nico 好了 , 然后请 Nico 跟大家打个招呼 。

王国鑫1:45

好 , 大家好 ,也很高兴有机会参加 《 十字路口 》 这个节目 , 然后谢谢二位 。

Koji 杨远骋1:49

那我们来进入这个快问快答哈 , 年龄 ?

快问快答1:49

王国鑫1:53

40。

Koji 杨远骋1:54

你现在是在京东健康探索研究院的第几年 ?

王国鑫1:59

第三年 。

Koji 杨远骋2:00

在这之前是做什么 ?

王国鑫2:02

主要是做搜索和多模态的技术吧 。

Koji 杨远骋2:06

嗯 , 的 MBTI 和星座 ?

王国鑫2:07

我是 ENFJ 和双子 。

Koji 杨远骋2:10

那一句话介绍一下你们现在在做的这个产品 。

王国鑫2:13

啊 , 我们在做的产品就是京医千寻的医疗大模型和在它之上的 Agent, 医疗服务的 Agent。

Koji 杨远骋2:19

嗯 , 方便介绍现在的收入和利润吗 ?

王国鑫2:24

啊 , 这就送命题了 。其实现在 AI 整个来说还没有跑通完全的商业模式哈 ,但是京东健康其实上半年大概是 350 亿左右的营收 , 然后利润大概是 35 亿人民币吧 , 然后但是这块业务其实对我们来说承担的主要是回答医疗服务的未来以及公司的未来的这么一个答案吧 。

Koji 杨远骋2:42

对 ,其实你也说了 , 它现在它扮演的是一个向未来沟通的这么一个角色 。 它现在在这个一个公司的一个战略规划里面 , 它起到一个什么样的作用 ?

医疗痛点2:42

王国鑫2:53

基本是核心战略 ,因为医疗整个来说 , 说到底它是一个供给受限 , 然后服务成本巨高的一个行业 。 我们每个人对健康的需求是无限的 , 无节制的 , 我相信每个人只都想活的一辈子 。

所以 AI 在这个里面扮演的最大的特点就是能不能提升供给水平这么一个关键要素 。 所以它虽然很难 ,但是我相信不仅是京东健康了 , 所有立志于在健康领域有所发展的公司 , 甚至是国家的角度 , 它都对这个技术极其重视 。

Koji 杨远骋3:22

那我们来首先来说一说 , 就是也是你刚刚提到的你们在做的这个产品哈 , 大概其实 10 年前开始就在做这个方向 ,2018 年开始做互联网医院 , 然后现在做的事情可以说是从那个时候到的一个延伸吧 。

王国鑫3:37

我觉得可以是这么讲 。

Koji 杨远骋3:39

可以说一说你们就是在准备做这个医疗方向的大模型的时候 , 主要的考虑吗 ?

王国鑫3:46

我觉得作为一家公司 , 它从逻辑的角度还是要回答一个技术能为我带来什么 。其实最早的京东健康之所以有一点 , 我们叫它有一部分 AI 的能力 ,是来自于这么一个事实 : 我们用最新的财报的话 , 我们每天是有 49 万路的医疗服务的进线 ,也就是说每天有 49 万人次在我们这里寻医问药 。

那这样的情况下, 如果没有类似 AI 的分诊技术 , 没有质控技术 , 一我们满足不了这种精准的医患匹配 , 二我们没有办法保证我线上的医疗服务都是合规合法的 。

所以我觉得京东之所以一开始做 AI 的技术 , 最本质的逻辑是首先先把一个业务装在合规的笼子里 , 同时让这个业务的成本能够越低越好 。

这就是我觉得它做 AI 第一个时代想做的事情 。AI 第二个时代想做的事情就是我们团队也做过类似数字疗法的工作 , 甚至一部分脑机接口的探索 , 都在想一件什么事情呢 ?

因为医疗本身 , 我们不仅不仅是在线上跟一个医生做个视频打个电话 ,他就能解决的问题 , 我需要了解您日常的生活状态 , 了解您检验检查的状态 , 然后这种时候我就要用我们现在的行业的话术呢 , 就要把我的数据像两头延长 ,在治病前的生检讨和治病后的这个状态 , 要像两端这样的延长 。

那在这种延长的情况下呢 , 数字疗法技术就是最重要的技术 。 所以当时我们团队也做过了这个数字疗法的技术 , 然后再往后做的时候就进入大模型时代了 。

大模型时代最大的 , 我们叫它最大的吸引力 , 或者为什么这个大模型时代今天 ChatGPT 当年出来的时候给大家眼前一亮 , 实际上我觉得大家不完全是把它当一个产品看 ,而是它表现出高度的类人的水平 。

它的类人水平就表现在指令依存能力 。 所以在这个角度上讲 , 这一类的现在的大模型在医疗服务承担的就不仅仅是精准匹配 、 合规属性 , 甚至不仅仅是一个服务延长的问题了 ,而是大家在想 , 一我有没有可能创造类似医生服务水平的大模型 , 这样我能极度降低成本 ; 二如果这个大模型的水平进一步提升 ,是不是它可以成为我们生命伴

随的一部分 , 就是能够长久期的跟我们在一起 , 就像我的亲人一样 , 就像我们小时候父母关注我们的状态 , 太太关注我们的状态 , 到后来的子女关注我们状态 , 这样的一个想法 。

所以我在想 , 这就是这一代大模型和前几代 AI 最根本的不同是 , 它尝试着去解决这个行业最根本的痛痛点 , 就是供给能力 , 大概是这么一件事情 ,而且是一种低成本的方式 。

然后这里可能说一个小闲话 , 就是其实我在我们这个生活中有部分人 ,他是能享有 ,因为他的社会地位也好 , 或者他的财富也好 ,他实际上能够享受这种专家级的服务 ,但是我们大部分的芸芸众生 , 实际上是不太可能享受到这样的福利 ,因为我们社会是自然分层的 。

这种问题在欧美的比我们国内严重很多很多 ,他们的情况更更严重 。 那反过来讲 , 我觉得 AI 所有给行业 , 既不仅是医疗 , 给行业都是一件事情 , 就是它能不能低成本的扩大供给 。

如果它能低成本的扩大供给 , 那我们每个人都有一种均等的服务水平 。 那 OK, 那我们每个人都延长 3-5 岁 , 我相信这是所有做医疗 AI 的人最终极给这个社会 、 给这个国家创造的价值 , 我相信是 。

Koji 杨远骋7:06

这我自己一直很喜欢一个说法 , 就是说其实大模型它可能会让很多人的工作效率拉开巨大的差距 ,但是它一定可以提供一个价值 ,是让所有人的这个情绪得到平权 。

什么意思呢 ? 就是在过去其实很多人这个啊 , 会有一些多多少少的心理疾病啊 ,但是他根本得不到很好的照料 , 得不到很好的回应 ,因为心理医生本来就是一个严重稀缺的供给 。

呃 ,但是在现在这个大模型可以看见所有人, 可以这个接住所有人的情绪 , 甚至提供一些抚慰 。 我想刚才这个 Nico 在讲的也是 , 就京东做健康大模型可能是一个更加泛化 , 就从精神健康领域泛化到整个健康领域 , 可以给这个啊 , 基本上所有人吧 , 带去大家所需要的这个在未来的一些医疗上的建议或者指导 。

王国鑫7:54

这至少是我们的愿景 , 我也得努力 。

Koji 杨远骋7:57

但是医疗就是垂直领域的模型 , 它需要非常多专业的数据嘛 。 我觉得医疗这个领域它可能很特别的一个地方是 , 它有一个优势是这些数据 , 首先它理论上应该是非常标准化的 ,但是它很难的地方就是这个采集的过程和它的使用过程中所造成的影响也非常的大 。

数据困境7:57

王国鑫8:17

是是 , 我觉得这个问题我觉得可能就回应一下荣辉 , 就是说啊 , 我觉得是这样的 ,其实医疗有几个特点 , 我们叫痛并快乐着 , 就一方面确实因为我们国家过去很多年的啊 , 这种信息化的推进 , 然后对医院的强考核 ,其实我们医院相对于其他的啊 , 我觉得行业它的数字化水平是高的 , 这是一个不可改变的事实 。

你看我们今天啊 , 就像病例要严格的有它的规范 , 对吧 , 然后我们所有的影像有云影像数据 , 然后有质控 , 国内的医疗体系花了巨大的力气去跑过了这个信息化的时代 , 这件事情是所有做医疗行业模型的我们叫做幸运 。

如果说今天让我平地起高楼 , 我们今天还是用纸质的 , 像咱们小时候一样 , 纸质的这种报告 , 然后挂号收工单 , 那谁也搞不掉哈 , 谁也搞不成 。

这个是我觉得这是一个幸运 ,但是其实它还有很多难度 , 难度我觉得在体现在几个方面 。 第一方面呢 , 就是医学数据本身 , 它很多时候它是不可能记录完全的 ,因为这里面可能有工作的需求 , 然后有医院流程的需求 ,而且甚至说它本身就不需求 ,因为它不需要记录那么大规模的完整的数据 , 它只要解决用户的病患好 ,因为它医院的第一责任还是救死

扶伤嘛 。

Koji 杨远骋9:35

对 , 现在记录的数据也是提炼过后的一些数据 。

王国鑫9:38

很多是提炼数据 ,而且它的质量水平也不见得都是能满足需求的 , 我觉得是第一点 。 第二点呢 , 就是模型的学习和人类的学习 , 它有一个差异 , 就是人类它很多时候是会在抽象空间去学习的 。

就比如说我们培养个医生 , 或者咱们用培养医生 , 一般来说就看几个病例 , 跟主任看看几千个病例 , 医人是会有归纳能力的 。在这个过程中, 人往往是通过符号学习中归纳学习 , 然后能够提升这种认知水平的 。

那模型很多时候并不是这样子的 。 今天我们模型的训练方法还是基于原始数据的训练方法为主 , 那在这个就要求说它有大规模的推理数据或者大规模的原始数据 。

但是这件事情在医疗中并不存在 。 我们很多时候看到了患者有个症状 , 一个重要的医生他经过脑子想了之后 ,他经过判断了之后 ,他在病历中写下了他的判断 ,他的思考过程是没有的 。

但是这件事情呢 , 很多时候人通过大量的归纳 , 包括我们的口口相传 ,他实际上是有提习得的能力的 。

这也是为什么其实最近大家也说 ,其实过去几年一个很酷的词叫 self-learning 的地方 , 就是说模型什么时候能学会 learn 这件事情 , 可能是下一个 AGI 中重要的一个组成部分 。

我觉得这是第二点 , 就是它的数据本身就是有这样的问题 。 第三点呢 , 我觉得它里面还有几个特点呢 , 就是数据的敏感性和复杂性 。在这个过程中呢 ,其实您这么来看这个问题 , 我们重要的病例 , 或者大家我今天生病哈 , 我也是可能是跑好几个医院 , 首先它的数据就天然在物理上分散了 。

第二点呢 , 就是数据确权也有问题 , 就是今天这个数据在转化的程度上, 它属于医院还是属于医生 , 还是属于我 ,有这方面的问题 , 所以它有敏感性的问题 。

那第三点呢 , 它有专业性的壁垒 。 那同样的道理 , 你看我们最近的检验检查互认才才大规模的推广 ,以前我们检验检查都不互认 , 原因是为什么 ?

是即便是我们做一个 CT,也可能因为设备的原因 ,也可能因为仪器的原因 , 从而导致它的结果不见得完完全全就是可被共识的 。

这这倒真不是因为医院想挣那个钱 , 它很有很有可能是这么一个情况 , 它为了降低这个医疗的这个风险 。

所以在这个地方讲 , 就是它的复杂性 , 它的敏感性和专业壁垒比较高 。 这也是为什么医疗模型它是一个我们认为它在垂类里就是真的是最难 ,但同时也是最我觉得最有存在价值的一类垂类模型的原因吧 。

就是我们今天面临的困难 , 所有做这个行业的人都面临 , 所以大家其实在同一赛道上, 它它很难用单点的技术优势去去改变这件事情 。

Koji 杨远骋12:10

啊 , 说到这个垂直模型啊 , 正好想追问一下, 就在您看来 , 除了医疗的垂类模型 , 还有哪些行业有出现一个垂类模型的必要的 ?

垂类判断12:10

Koji 杨远骋12:18

因为今天其实现在有一个论调叫做基模会变得越来越厉害 , 基模很可能之后会满足这个泛化的很多的需求 ,但是看上去医疗这个领域是需要大模型的 。

然后在您看来 , 还有哪些领域需要这样的垂直大模型 ? 这背后可不可以抽象出一些就是需要这样的模型的垂直领域 , 它具备哪些特征 ?

王国鑫12:40

嗯 , 我觉得咱们先回答您最后一个问题 , 就是抽象的这个问题 。 因为我自己在内部也申请预算 , 然后跟跟管理层申请预算 , 所以我必须得回答为什么要做这个事情的必要性 。

那我肯定要抽象出一个逻辑来 。 我觉得一个逻辑有几个点 , 第一个点就是它这个行业的数据或者是不是相对于低成本可获取的 , 或者低成本可模拟的 , 那这件事情就是一个啊 , 一个行业的必要性 。

这是第一点 。 第二点呢 , 就是它的今天的商业模式是不是很显见的 。 哎 , 这个话其实很有意思 , 就是很显见的 。

如果是很显见的东西 , 你可能也不见得真有垂类的机会 。 然后这是我 , 这是我从一个从数据的要求角度 , 再从一个商业化的角度用二维空间去划分的哈 。

比如说咱们举个例子 , 数据如果是很显见的 ,而且是低成本可以模拟的 , 那换句话说 , 这个行业本身的知识门槛不高 , 那这个行业的本身知识门槛不高 , 或者是说这个行业所过去所掌握的这份经验 , 被新的技术所容易替代 , 那这件事情就比较费劲 。

比如说咱们都说教育模型 , 或者叫做我是一个更好的数学老师 , 或者是一个更好的英语老师 , 今天我们普遍认为学习语言这件事情 ,AI 的教育能力可能要比人的教育能力要高 , 原因是它的知识是显见的 , 可模拟的 。

同时呢 , 它能克服大家的这种心理状态 , 比如说我对陌生人讲外语 , 能克服大量的这种心理状态 。

所以我们是这样子的 。 还有一点呢 , 就是它的知识不见得是外显的 , 甚至有可能我需要花很大的力气去治理 ,但是呢 , 它的商业模式足够清晰 。

那这件事情在摆在我们面前的是什么 ? 是代码 。 您可以看 , 现在的代码模型往往是个独立的模型 , 甚至我们认为 Claude 可能就是一个专门为代码优化的模型 , 我们甚至可以这么讲 , 对吧 , 就是像这些家公司的所有商业模式压在了一个垂模上 。

某种意义上说 , 我们今天看到的所谓的 coder 的 model 其实就是个垂模 ,是吧 ? 那它为什么这件事情也是通用模型公司的菜呢 ?

原因就是它的商业态让通用公司无法拒绝 。 今天今天哪有一个通用公司不写代码 ? 就是换句话说 , 就是我们这帮人可能咱们跨引号的成本太高了 , 所以所有的公司都有个欲望说 , 哎 , 咱们能把 Nico 这个团队不要 , 然后全部让他机器人, 然后就能干 。

当然这是玩笑话了哈 ,但是但是它的商业模式是极其外显的 。 所以呢 , 就是在我们里讲所谓的垂模就有两点 , 第一点就是它的数据是否拥有独占性以及独特性 , 切破破解性 。

第二点呢 , 就是它的商业模式是不是足够清晰 , 已经足够高到说大家不能去放弃它 。

Koji 杨远骋15:10

对 , 想到我们 , 对 , 哎 , 就想到我们上一期播客的嘉宾是 3D 大模型的这个创始人 ,他们这个 Vast 啊 , 然后他也提到他们的这个训练的数据是他们一个非常核心的竞争力 。

然后当问到 , 哎 , 你们的这个数据从哪来的时候 ,他说如果这个都说了 , 我们的最底层的商业经历就被透露了 。

我们再说回咱们的医疗大模型啊 , 就是在您看来啊 , 今天仍然会有看病难 、 看病贵 , 就这些大家都熟悉的问题 。

然后我们一开始也提到了这个 , 你们的愿景是要让 AI 去改变 。 那到目前为止啊 , 就到咱们录播客的这个 2025 年 9 月份的这个时间为止 , 就您看到 AI 已经带去了哪些改变了 ,有哪些又是你觉得可能在未来三五年之内会慢慢带来的新的改变 ?

王国鑫15:56

我觉得 AI 首先改变了一个 , 就是信息获取的平权 , 这件事情其实是了不得的一件事情 。 然后您可以看说大家以前其实你看我们就不要提具体的公司的名字 ,以前我们大家当有病患的时候 , 第一反应都是采用搜索引擎的方式去获得信息 ,而搜索引擎固有的商业模式 , 它是竞价排名的商业模式 。

所以在这个过程中啊 ,以前也跟啊政府的合规的部门然后去探讨的时候 , 就在探说很多时候这种商业模式本身就促进了这种信息的错配 ,而不是信息的合理适配 。

那今天大模型解决了一个问题是说 , 我们大家对于所有大模型的衡量 , 都是它是否能够更遵守遵守物理的实际结果 。

而且今天大模型本身在上面 , 我们当然大家都在思考商业模式 ,但很少有人思考的商业模式是说我解决一个信息匹配的问题 。

我们所有的商业模式都是在于说 , 我能给你提供高质量的 AI 的绝对高质量的知识和信息服务的基础上, 我在想怎么做商业模式 。

所以没有人去挑战这个信息匹配的问题 , 它从一个信息匹配变成了一个信息绝对正确的生成 。 所有团队最终追求的都是这个目标 , 最优秀的团队都在追求这个目标 。

所以 AI 今天大家其实很多时候不要去低估我们今天从一个原有的搜索引擎的模式转变成从一个问答或者 Chatbot 的模式 , 它实际上背后蕴含着我们普通人获得信息的准确性在极快速的升高 。

所以这件事情如果能从医疗的角度 , 所谓的看病难 、 看病贵 ,在这个前提是有一个健康认知 , 就首先大家要尽可能的减少疾病的发生 。其实这件事情很多时候这种重点我们被被我们忽视了 。

比如说最简单的 , 我们呃 , 人均的 40 岁以上人群的胃肠镜的渗透率 , 然后比如说我们体检的渗透率 , 比如说我们检验检查质量的把握 ,其实这些技术在很大程度上说都可以通过 AI 的帮助或者 AI 的辅助渗透进一步的教育 , 我们叫做教育患者或者叫教育整个社会 。

Koji 杨远骋18:00

所以的意思就是说 , 大家在和 AI 对话的过程中, 可能会听到更多来自 AI 的这样的健康建议 , 所以更多的去做体检 , 去提前做胃肠镜等等。

王国鑫18:10

对 , 我觉得这件事情我觉得是首先第一步怎么可得的 。 第二步呢 , 我们今天谈就是今天当时当刻我们今天在解决什么问题 。

今天当时当刻我们实际上在解决这么一个问题 , 就是说我们能不能通过模型首先解决一个分诊的问题 , 或者我们能够区分用户的状态的问题 。

那我可能识别你是轻症还是重症还是急症 , 我们通过轻症的方式 , 我们给出你标准的解决方案 , 我们重症和急症 , 我们能够直接快速的链接到医疗服务资源 。

那这件事情原有的 AI 是原有的系统都做不到 。 为什么我们原有的系统 , 大家看看这种信息系统 , 要么我们到快速的到线下挂号 , 或者我到互联网医院去找一个医生 ,但现在的做法不一样了 。

如果有一个 AI, 它首先平时日常也就在收集你的数据 , 这种关键的时候呢 , 它又能针对你的这种病情变化 , 能更好的直接导向你具体的资源结果 , 它解决了一个匹配成本的问题 。

所以看病的复杂性被降低了 , 这是我们今天讲的第二个事情 。 它不见得是解决看病难 ,但它的复杂程度以及心理门槛被事实上的降低了 。

第三点就是回答一个最根本的问题了 , 就是今天的 AI 的辅助诊疗能够做到一个什么样的水位了 。 这就是所有做 AI 大模型的人最终的一个战战场 , 就是说我如果我的辅助诊疗能够高可信 , 然后人工这个时候很多时候只是去 check, 只是去 review 这个结果 , 那这样子的情况下, 我就能够至少在普通的疾病上, 我就能够把我的这种服务能力像 7×24 小时延伸

, 我对于人的要求就逐步降低了 。 这样子的话 ,在一定程度上解决了看病难的问题 。 最后我们讲讲那个看病贵啊 , 看病贵其实讲的是急症的问题或者重症的问题 , 我们很多是这么一个问题 , 特别是重症的问题 。

那我们这个时候 AI 对它的最大的帮助不在医疗服务层面 ,而是在于疗法研发层面 。 今天的 AI 有几个东西其实没有被或者叫做可以被更加的挖掘 , 一个是 AI 对于科研能力的帮助 。

今天每天行业内 , 我我忘了一个具体数字了 , 就是每天有多少医学的论文去发表 , 包括我自己所在的 AI 行业 , 坦诚的讲 , 我今天是看不完我这个行业的论文的 , 我只能去看那些最高水平的论文 。

所以对于一个医生来说 , 它是它是一个终身学习的行业 。 所以我们很多时候就解看病贵的时候 , 我们的一个大的呼吁都是应该有医生的服务型的 AI 能够持续的提升 AI 的能力 ,而而医生的能力这件事情反过来其实才能提升我们整体的卫生水平 。

因为医生不行是根本性的 , 医生不行它就肯定是不行 。 所以我们就是能解这么一个问题 。 第二点呢 ,AI 今天坦诚的讲是制药或者我们新疗法研发中的一个必要的核心组件 , 只是说它不像我们今天所谓的 ChatGPT 这样是一个 to C 的产品 , 大家感知更强 。

我们今天去今年我们看到了创新药的行情 ,其实背后的逻辑是中国 BD 出海的水平变高了 , 我们的这个 license 卖的变多了 , 那一定是因为中国的这帮企业掌握了更新的研发能力 , 提升了我们新药研发的速度 。

所以这件事情在背后实际上是解决看病贵的一个根本的逻辑 。 所以总结来看 , 我们其实几点 , 就是一个就是提升我们本身的意识 , 降低我们拿到错错误信息的概率 , 那 AI 就是给我们正确的信息 。

第二点呢 ,是解决我们轻症或者级别的这种这种所谓的诊断 , 让它的辅助诊断水平进一步的提升 , 让大家的心理门槛降低 , 让大家的服务门槛降低 。

那最后一点呢 , 它不论是在医生的培训上, 还是在新疗法或者新药的研发上,AI 其实是一个决定性的要素 。

所以大概我觉得看病难 、 看病贵 , 如果从长周期的角度上讲 , 这三件事情应该是最重要它能改变的点了 。

Ronghui21:52

你刚才提到这个愿景很美好 ,但我觉得这里面其实还有一个问题是 , 就是解决这个医生整体这个资源比较少的这个问题 。

但是其实还有一个很大的门槛是对于更多的人来说 ,他用 AI 他其实也需要被教育 ,他也有很高的门槛 。

王国鑫22:09

嗯 , 这件事情本身其实到啊 , 我可能有一点不同的观点 , 就是说啊 , 我那个呃 , 给您举个小案例哈 , 然后那个案例让我当时对这个问题产生了巨大的怀疑 。

就是有一次我坐航班 , 那个航班晚点了 , 然后呢 , 我肯定闲得无聊 , 然后我就旁边有个大爷 , 然后那个大爷就拿出手机来拍这个机舱 , 然后我就比较敏感 , 我就说哎 ,他在干什么 , 就是不好意思就看了一下人家的屏幕哈 , 很不很不应该 ,但是干了这个事 。

然后他就再问一个 Chatbot, 就说哎 , 这是个什么飞机 , 然后机型怎么样 , 然后啊 , 哪个位置最舒服 , 然后怎么怎么样的问题 。

就是说就是我会觉得 , 尤其是在中国 ,其实其实 AI 的产品的渗透率今天有点超乎人们的实际预期 ,是有点超乎人们的实际预期 , 只不过是今天的 AI 的产品 , 它好像没有我们经历的移动互联网那个时代那么在 C 端上那么出挑 。

但是在某种程度上说 , 它在信息服务上已经让人产生了一个很惊讶的表现了 。 然后从实际的那个行业数据来说也能看到 , 就是说在十几岁孩子的渗透率和在四五十岁人群以上的渗透率 ,AI 都表现很好 , 这是也是表现出人群渗透率双高的一个表现 。

所以我在讲今天 AI, 你看至少我们今天可以说一个模式 ,AI 的 Chatbot 某种程度上说可能要把搜索引擎这个形态在一定程度上说扫到垃圾箱里了 , 至少在中国啊 , 至少我们可以可以大概可能说一个很危险的言论 ,但是可以这么去探索 ,也是为什么其实去年 Google 曾经一段时间的股价如此承压的一个表现 。

这也是其实在别人的眼中看说 AI 的这种知识 , 它直接给我 information, 直接给我 knowledge, 你已经直接给我 knowledge 和 answer 的时候 , 我为什么要看 information。

所以所以站在这个角度上看 , 就是我是觉得 AI 的对于 AI 产品的渗透率 , 我是保持一个高度乐观的 。

而且我我的一个观点就是 ,不论是咱们三个 , 我相信在座的所有人, 特别所有听众 , 我大家幻想一下, 大家想象一下, 能不能回到三年前没有 AI 的时代 , 我们今天的生活能不能回到那个时候 , 您的日常生活 , 您的生活能不能回到 , 我相信这这个答案是否定 。

Koji 杨远骋24:18

我昨天看到一个问题 , 就是说给你多少钱 , 你愿意过上这个没有 AI 的生活 , 然后前提是旁边的人都有 AI, 就只有你没有 , 你愿意就是 take 多少钱 。

对 , 然后我当时认真的想了一下, 我觉得哇 , 这个真的对我来说好像非常的困难啊 , 比如说给我一个亿 , 我同不同意 , 我觉得我都都认真的想了一想 , 哈哈哈 。

王国鑫24:40

非常非常困难 ,因为因为这个就是这种生产力背后的巨大的认知代偿 , 它有时候不是能用单点的金钱去衡量 , 就像我们在一度 ,因为我自己正好经历过那个从互联网到移动互联网的时代 , 那个时候我记得最大的一个特点就是不可阻挡 , 你感觉所有的事情好像那个东西本身就是 PC 上做的很好 ,但是不可阻挡 , 就是这个过程是不可阻挡 。

所以我们的 AI 今天 , 我觉得 AI 今天的作为一个生产力 , 它很多时候表现有弊端的属性 , 所以我们在 C 端上它的特点还没有那么大的进化 。

但是坦诚的讲 , 我们的这个产品的渗透率已经足够优秀 , 否则今天不会所有的产品都好像一个默认的动作 , 就是把搜索框变大是吧 , 你也不知道为什么 , 哈哈哈 。

Koji 杨远骋25:24

对 ,是的 , 对 , 我觉得还是这个 , 我也我也同样很乐观吧 。

Ronghui25:28

这个说回这个垂直模型啊 , 这个我们来说一说 , 就是你们这个京一千寻模型 , 从应该是 23 年发的 1.0 到最近的这个 2.0, 可以给我们的听众大概介绍和科普一下这个模型 , 它的主要的进化都体现在哪些地方吗 ?

模型进化25:29

王国鑫25:47

我觉得主要其实进化体现在两个地方 , 第一点就是我们的研究模式发生了比较大的变化 , 就是在一的时候 , 我们普遍还是使用这种啊 , 我们叫它叫做叫做所谓的真实的知识数据 , 比如说论文也好 , 或者是学科的文章也好 , 或者是教科书也好 , 然后大量的真实病例也好 , 然后这是我们构成了我们一个大的数据底层 。在二的时候 , 我们实际

上花了很大的力气 , 做了大量的合成数据的努力 。 所以这次京一千寻 2 中不仅是一个模型 , 我们这次把我们在医患对话的合成的 Agent 也免费向行业开放 。

它虽然不是开源的 ,但是大家大家可以通过这个接口去服务 。 那这件事情一个好处对行业的一个贡献 , 就是行业可以通过这个接口 , 可以尽可能的模拟真实的医患对话 。

Koji 杨远骋26:35

它是直接来到你们的模拟数据 , 还是它自己进来也可以开启模拟 ?

王国鑫26:40

它可以进来开启模拟 , 就是它就是一个医生 , 然后您可以问它任何问题 , 您可以帮它模拟问诊 , 它就可以帮你模拟诊间的一个患者和医生的真实对话 。

但所有的数据都是就是背后都是就是我们训练的一个模型去支撑的 。 所以这件事情您可以认为说算是我们有一个新的认知 , 就是就刚才正好回应那个荣晖的观点 , 就是其实医疗模型很多时候不能完全基于现有的数据 ,因为这个现有的数据实在是太困难获得 , 所以模拟数据或者叫我们叫合成数据 , 或者叫 Agent 模拟是一个必然的路径 。

所以 2.0 我们的第一个变化是在里面 , 我们还是采用了大量的合成数据 ,而且我们评估这个合成数据应该是高水平的 , 这也有赖于京东健康实际上每天有 49 万路的问诊 ,有赖于这个 。

所以我觉得我们是有我们是有有本事 , 或者我们是有基础做这件事情 。 所以这是我们觉得在数据层面的第一个问题 。

第二个层面的问题是在这个模态层面的问题 , 就是这次其实我们一个大的改进是在单一的模型里能够支持影像数据 , 我们支持 CT、MRI、X 光都能支持 ,因为这件事情是来自于一个真实实践 , 就是说在医疗领域里 , 如果我们就是把自己锁定在文本模态 , 它跟真实的世界离得很远 。

今天哪怕是我们如果已经咳嗽超过一周以上 ,其实医生都建议做一个筛查 , 对吧 , 更何况就是更复杂的这种疾病 , 影像在我们这个生活中今天是一个最重要的一个诊断工具 。

所以我们一二和一相比 , 就是在模态层面上经历了一个巨大的提升 , 就是它不仅能够理解这种医学的语言吧 , 还能够精准的理解这种影像的资料 。

我觉得这是二上面的区别 。 第三点区别呢 , 就是在推理上的变化 。 以前我们推理其实其实我以前也说过 ,其实我挺不喜欢这个词的 ,因为这个词在中文翻译中它有二义性 ,因为当我们提推理的时候 ,其实讲的是像咱们咱们这种人类的水平是吧 ,在哲学层面的推理 , 我可以去联想 , 可以去思考 。其实模型的推理我觉得咱们坦诚的讲 ,其实它更像是一

个啊格式学习 , 然后它通过更多的算力以提升了最终答案的准确度 ,是这么一件事情啊 。 或者它不是我们说的哲学层面的推理 ,不是人的推理 , 至少我是这么认知的哈 ,但可能跟 AGI 派可能有点不一样 , 我是不是这么认知的 。

所以反过来讲 , 就是我们这次推理呢 , 就是说这是所在医疗的行业中一个特点 , 就是你的推理过程首先也得被验证 。

那这件事情我们也跟我们的循证库进行了对接 。 举例来说 , 我的推理过程是因为 ABC,A 我是通过哪个证据拿到的 ,B 我是通过哪个证据拿到的 ,C 我是通过哪个证据拿到的 。

然后我们还把证据分了等级 , 比如说在最高的期刊发表的论文 , 最好的期刊发表的论文 , 或者国家颁布的指南 , 那我们认为它的证据等级最高 。

我也是基于这种证据等级 , 所以做了如下的诊断和判断 。 所以您可以认为说我们这一波推理 , 我们叫它循证推理 ,而不仅仅单单的是说一个推理的模式 , 或者我用消耗更多的 Token,不断让它去思考这么一种方式做 。

所以这是三个大的眼镜 ,在这三个大的眼镜上, 我们认为是啊千寻 2 值得起一个新的版本号的一个原因吧 。

然后另外就是它有个很酷的 Demo, 就是说它可以它的思考的过程 , 就是我们刚才说推理的思考过程 , 它实际上是一个多模态的 ,也就是说我们不仅仅是在文本层面说因为 ABC, 那我们可以拿个影像的片子 , 然后它甚至可以锚定到某个病灶 , 说我基于这个病灶的状态 , 我是做这样的推理 , 基于你肺部的这个状态 , 我能做这样的推理 。

所以它的推理过程不仅仅是一个文本的 , 它是一个多模态交互式的这么一个推理 。

Koji 杨远骋30:13

刚才您提到第一个大升级 , 就是用了非常多的合成数据 , 这个合成数据我理解其实是医患之间的问诊对话 , 然后您也提到说你们用很多办法去验证这个对话它的真实性啊 ,以此才能拿去做训练嘛 。

但是我好奇的就是啊 , 怎么去验证这个医患之间的对话所谓的真实性啊 ?

王国鑫30:33

其实这个问题就得回答那个 , 正好就是所有医疗的那个问题可以一遍回答 , 就是说啊数据的准确性 、 模型的准确性 ,以及经常有人被挑战说你这你这模型怎么验证的 ,其实就这个问题啊 。在我们内部实际上是这么一个流程 ,在我们研发过程中, 我们肯定是做了很多评测数据集 , 然后自身的去去对比这个数据集的优劣 。

但是我们任何一个 Launch, 就是模型 , 我们指的 Launch 不仅是对外开源 , 就是我们上线一个 Launch, 实际上我们一般是经三步的人工验证 。

坦诚的讲 , 这个就是很成本很高 。 第一点我们叫 in-house 验证 , 就是因为京东健康本身是有一个大的全科医生的团队 , 我们叫 in-house doctor, 就说啊这些医生都是京东健康的雇员 , 然后所以他们会对这个进行一个科室的分布的评价 。

然后我们主要是通过五六个核心的指标去衡量 , 包括它的忠实性 , 包括它的准确性 、 专业准确性 , 包括它的流畅度 , 包括它的一致性等等这些问题 。

第二点呢 , 我们就有一个 third party, 我们跟几个大的医学院有合作啊 , 当然也是因为商业合作的原因 , 我们就不方便提 , 就说他们会有一个 third party 的组织来帮我们 , 就说我们一个大的 Launch 之后, 然后我们因为有一些合作关系 , 这样的话我们他们会先拿到我们的模型 , 然后去去去做二次评估 。

然后第三点呢 , 就是我们会有一个更大层面的 , 大概 100 多人的专家团队的评估 , 那这个就不仅是一个是不是 third party,也不是这个 in-house,而是我们组织的这个质控委员会了 , 那它是来自于整个医生 , 然后来去看 。

所以今天呢 , 特别坦诚的讲 , 就是这个通过这个工作 , 我就一下子回想起来那个 ,因为我们这工作很重嘛 , 我就一下子回想起来那个 OpenAI 不是发了篇文章叫 Health Bench, 然后当时那篇文章的时候 , 我记得 CEO 还问我说这篇文章代表什么含义 , 然后我我就跟他讲 , 代表着 OpenAI 验证医疗模型也得用人, 哈哈哈 。

所以他那个 Health Bench 你可以知道 ,他大概是 60 多名医生 ,其中有中国的医生参与 , 然后大家去手写的这么一个 ,但是他也用了很多技术的方法 , 手写的这么一个一个 Bench 吧 。

然后所以我我们自己内部的就是有三层的这么一种这种模式 。

Koji 杨远骋32:42

啊 ,因为咱们合成的数据的量应该是非常大的 ,在只有 100 个这种数据校验的专业的团队的情况下, 我们怎么才能够去核验那么多数据呢 ?

王国鑫32:53

对 ,其实这个流程挺简单 , 您可以把它想成一个漏斗 , 就是说首先呢 , 漏斗不是一天灌满的 , 这是第一点 。

所以我在我持续迭代的过程中, 能知道模型的问题 ,以及它合成数据的 bug 在容易出现的地方 。 所以这样的话 , 我自然就把合成数据分级了 , 这是第一点 。

第二点 , 每个漏斗的上方都是技术手段 , 对吧 , 我的技术手段尽可能的去模拟下方的医生 , 就是我尽可能希望我用机器的评估的方式 , 要接近人的评估水平 。

那所有上面的上位的这种机器的工作团队 , 都在想怎么去模拟下面的一个机器的评测水平 , 人工的评测水平 。

所以您可以认为这是一个漏斗 , 研发的同学解决的是我尽可能要把少的数据漏到下面去 , 然后但是同时技术的角度是说 , 我要尽可能把那些严重的问题漏到下面去 。

所以您可以认为说它是一个持续迭代的漏斗 ,但如果您说它是不是 , 我们是不是每条数据都看过 , 这确实不是 。

但如果说我们某种意义上说啊 , 就是大模型是个什么 , 大模型是个贝叶斯 ,是个概率嘛 , 那就是在概率角度上说 , 我们尽可能的提升这个概率 , 那我觉得是这个答案 , 就是尽可能的要把重的严重的 , 然后容易错的往下漏 , 尽可能要把简单的直接的往上浮啊 , 当然这里面有一些技术手段去做 。

Koji 杨远骋34:06

明白 。 哎 ,其实说到这个模型水平啊 , 然后我自己就有一个非常大的好奇 , 就是我今天如果身体不舒服或怎么样 , 我其实还是会去第一反应问 ChatGPT, 然后我感觉它其实多多少少也能给我我自己认为还蛮准确的答复的 。

对比GPT34:07

Koji 杨远骋34:23

呃 , 所以我也很想知道 , 就是咱们还是这个 80 人的团队的吧 , 然后大家付出了那么多的时间精力 , 努力去训医疗大模型 , 那在比如说哪些地方是可以做的比基础大模型更好的 , 比如说有没有一个比较具体的问题啊 , 我如果问咱们比起去问 ChatGPT 啊 , 我就是可以得到确实更准确更全面的一些回应 。

王国鑫34:47

我觉得这个例子其实蛮多哈 , 我觉得可以举两个角度去看这个问题 , 一个讲一个单模态的 , 一个讲一个多模态的 。

我们先从单模态的来讲啊 ,其实今天的大模型呢 , 就是真正的医疗大模型 , 它需要我在我们内部讲叫拟人能力吧 ,但这个词其实有点二义性 ,其实我们是拟专家能力或者拟医生能力 , 我觉得更重要是这么一个点 。

所以很多时候 , 当我们在看到这种所谓的这个 GPT 也好 , 或者看到 Grok 也好 , 然后我们很多时候因为我们本身是患者 , 所以可以不厌其烦的去回答这些问题 。

但如果从医生的视角 , 你就会发现 , 从医生的角度上看 , 医生要的是说通过短的对话 , 通过核心的问题 , 然后快速的做一个判断 。

那这件事情说在模型的角度 , 它就不是一个事无巨细的问答 ,而是说基于某个专病的核心答案 , 核心问答 。

所以在这个过程中, 其实您可以看到说 , 这就是一个通用模型和专用模型在行业知识上的一个区别 。 因为通用模型它很多时候说基于你的症状 , 它可能通过教科书学 , 这个症状可能有这么多种问题 , 可能有零零总总这么多种问题 , 然后它为了排除一切概率 , 它就把所有的问题都问掉 , 对吧 , 然后从而最后给你一个相对全面的一个答案 。

但实际上医疗模型它很多时候 , 虽然我们说做诊断这个词很敏感 ,因为有合规性问题 ,但是真正的医疗模型 , 它得基于类似医生那样的啊重点的问题 , 重点询问 , 然后基于您的所有的信息 , 快速的做出一个判断 ,而不是事无巨细的说你可能有一个 、 三个 、 四个 、 五个问题 , 这其实是不对的啊 。

所以我觉得这是我们叫它不能叫做通用模型不能做 ,而是说它不符合医学伦理或者医学实践 。

我们来讲第一个问题 。 第二个问题就是 , 如果从多模态的角度 ,其实就更有意思了 。 大家其实我们今天经常使用这个问题是吧 , 排成什么照片 , 或者啊经常我们说收篇论文 , 然后让他给我翻译 ,其实这都用了的这个多模态能力 。

但如果您可以去试一下, 如果用我们这种 GPT 也好 , 或者是其他的模型 , 就去让他去看影像 , 您可以认为说它其实效率就会大打折扣 。

然后而我们的模型是专门为影像去设计的 , 比如说它对于这种啊专业词汇叫 positioning 哈 , 叫做或者叫做啊或者叫 placing, 然后就说它对于这个脏器的位置左右的对称的敏感度 , 或者是小的病灶都很高 。

但是模型的话 , 大的模型的话 , 它其实不会对于这种啊多模态的数据进行一个专门的优化的 。 就我说了 ,其实对它来说 , 这不是一个大的商业模式机会 , 同时也有数据墙 。

所以在这个角度上看 ,在多模态的效果上, 我们自己评测实际上是差异还是比较明显的 。 这大概是我们两两个能讲两个两个方面的案例啊 。

Koji 杨远骋37:31

对 , 多模态其实我非常容易理解啊 。 然后在这个单模态 , 比如我们就说文字的一个问题 , 比如说有没有一个具体什么问题 , 我我想比如说我说我今天感冒了 , 那可能两边机模和垂直模型得到的答复差不多 ,但是比如说我要上升到一个什么样的复杂度 、 专业度的问题 , 这是可能就会不一样了 。

王国鑫37:51

其实您只您可以去尝试问一下, 比如说最简单的 , 我今天发烧了 , 就这么一个问题 , 然后您可以试一下我们的 Agent 和通模之间的一个比较明显的本质区别 。

而且最好是这个产生的结果 , 可以用真人医生的角度再去 review 一下, 你就会发现说不同的模型对于医学的遵守或者专家习惯的遵守 ,是差异是相当相当大的 。

如果你说我那边发烧了 , 一般的通用模型可能会事无巨细的问你很多问题 ,因为在它的学习里 , 它的因为发烧是一个极其通用的症状 ,但实际上在卫生经济学角度其实不会这样 。

Koji 杨远骋38:28

哎 , 我我我们下来可以这个在机模和在咱们的模型里面啊 , 就分别去问 , 然后把这个链接附在我们播客的 show notes 里面 , 然后感兴趣的朋友也可以去对比看一看 。

就我还是比较好奇 , 就是因为像 OpenAI 他们也会就是基于医疗这个 , 基于医疗这个方向有一些 , 比如说跑分 , 然后我看你们也也在公布那个 MedBench 对吧 , 上面的一个成绩 , 就是那对 ,其实对我觉得对普通用户来说 , 可能大家最直观的就是去看哎 , 谁跑分跑的成绩高 , 怎么样让普通用户更直观的感受到这个准确性 。其实我觉得您刚才说的这个

问题是一个服务体验的问题 , 就是说就是所有的大模型 , 如果一旦 2C 之后, 我们叫它体验拐点的问题 ,而不单纯是一个跑分的问题 。

坦诚的讲 , 跑分它实际上更多是一个技术拉动 , 就是说哎 , 我们要做到那个水位 , 我要做什么 。

很多时候跑分和实际的产品体验之间 ,其实没有 100% 的关联性 ,其实这也是今天大模型评测的一个核心困难 。

就是说反正大家都不差 , 都不差 ,但是在真实业界的时候 , 真实使用的时候 , 可能哎 , 好像差异还有一些 。

那在这里面其实有模型本身的问题 ,有产品设计的问题 , 甚至还有交互设计的问题 。 所以这就涉及到模型和以及 AI 产品该如何设计的这个问题 , 可能今天不是咱们今天的话题了 。

所以这是第一点 。 第二点我觉得什么是好的一个体验呢 , 就是在我们认知中啊 , 像专家那样的啊服务能力或者是服务体验 , 就是一种好的体验 , 就是我尽可能的啊模拟专家 , 就是我们好的一个服务体验 。

这是第一个我们的认知哈 。 第二个我们的认知是站在我的角度啊 , 很最重要 , 医学最重要的不完全是一个体验问题 , 医学最重要的还是它的诊断准确和处置方案有效的问题 。

所以就是在我们这里面 , 可能专业性的要求在一定程度上说压过 , 甚至是压过 , 当然我们也有评测啊 , 甚至是压过了所谓服务能力这件事情 , 或者叫服务体验这件事情 。

当然其实啊 , 这么说可能有一点绝对主义哈 , 好像其实在我们内部 , 我们也当然也训练这个模型的共情能力 ,也希望它不要那么没情商是吧 , 说点漂亮话 , 然后天冷了也会嘘寒问暖 , 根据这个 context 训练嘘寒问暖 。

我但是我只是说这部分能力 , 某种程度上说它是可以剥离在医疗模型之外的 , 就是它是一个通用能力 , 说漂亮话是一个通用能力 ,而医疗最根本的圣杯还是诊断准确和处置方案有效 , 这两件事情是永远绕不过的 。

所以啊 , 所以这就是可能不同人的观点 , 就是站在我的角度 , 我觉得这两件事情只要能够做到 , 然后接下来做的事情 ,是用一个更好的产品去服务消费者就可以了 。

至于跑分这个事情啊 , 我自己一直我们自己内部的状态就是可以跑也可以不跑 , 甚至也经我经常其实被人去问说跑不跑 ,其实我自己觉得说这件事情很多很多时候 , 这个跑分的结果和我们 in-house, 就我们内内部自身的专家评估 , 它有时候对不上 。

那站在我的角度 , 我还是更相信真正专家的评价指标吧 , 这可能是这么一个情况 。

因为其实跑分就是这个分 ,也是有另外一群专家所定义出来的评判维度嘛 , 只是说大家可能不同的专家群体 ,他定义的评判维度不太一样 。

王国鑫41:44

对 ,而且他是定死的 , 我觉得嗯 。

Koji 杨远骋41:46

哎 ,其实说回刚才那个用户体验 、 交互体验的话题啊 , 昨天在 JDD 大会上, 然后我看到咱们这个京医千寻的也有一个这个很大的展区 , 然后我去和产品经理交流 , 我就有问他同样的问题 , 就我的一个这个医学问题 , 问机模和问你们有什么区别 , 然后他其实给了我一个很有趣的一个答案 。他说其实在咱们的 APP 里面 , 就京东健康 APP 里面会建患者档

案 , 然后你在使用这个京东健康的 APP 的过程当中, 你过去的所有的这个疾病史和慢病史我们都是知道的 ,因此不同的人问同样的问题 , 就会根据你个人的健康情况 、 慢病情况给出所不一样的答复 。

王国鑫42:26

是 。

Koji 杨远骋42:27

对 ,而且还可以应该我理解是可以建家庭的这个档案 , 比如我问小孩的问题 , 问父母的问题 , 对 , 我觉得这个其实是一个看上去很小 ,但是我相信机模不太可能做啊 , 要不他就要做的太细分了 。

但是做在一个健康的一个垂直的一个产品里面 , 就有它的价值 。

王国鑫42:42

是是 , 我认同您的观点 。

Koji 杨远骋42:44

然后咱们再说回来 , 刚才其实您提到说好像情商它不太是这个呃 , 咱们做医学大模型的两个圣杯之一 , 对吧 , 你觉得它是可能相对次要一点的 。

但是这个王小川在另外一次访谈里面 , 我们其实看到他在讲这个百川要造医生 , 这背后其实有一个他想表达的意思 , 就是这个医生要学会怎么和病人以及与病人的家属去沟通 , 就这个沟通本身的重要程度也是非常高的 。

那所以想看一看 , 就是 Nico 你们这边啊 , 针对就是造医生 , 或者就是帮医生 , 就是或者帮 AI 去更好的像专家一样呃 , 安慰用户 , 安慰患者 , 安慰患者家属 , 从而让他们更好的这个更理性的接受一个诊疗的方案 , 就在这些方面咱们有做一些工作吗 ?

王国鑫43:34

是这样 ,其实在内部我们您您可以认为说大的评测 ,其实很多用评测的角度看能力就最清晰了 。 我们大的评测线分体验线和专业线 ,其实我们刚才讲的治疗准确呀 , 问诊准确呀 , 然后方案准确呀 ,其实都会归在我们的专业线上, 然后然后我们这边都会归为我们的叫做体验线 , 就会归归为什么 , 就像您说的一样 , 沟通技巧啊 , 安慰啊 ,

然后沟通能力啊 , 都会分为我们的体验线 。其实我想表达的是这样子 , 就是说其实沟通技巧这件事情和专业这件事情 , 它本身并不冲突 。

很多时候这个模型能力是可以证交的 。 嗯 ,其实在这里如果偏要从研发的角度 ,其实很简单啊 , 就是说我可以用一部分数据和算法提升我的专业力 , 我还可以用另外一部分数据和算法提升我的共情能力 , 然后我把它训在一个模型里 , 然后再通过提示词的激发 , 你会发现模型很多时候是能做这件事情 。

这也是今天这个大模型参数量达到一定之后的一个明显的特点 , 就是说它具有泛化应用单点知识的能力 ,不像以前的模型需要把一条完整的数据全背回给他造的那个来 , 对吧 。

所以所以我理解就是我们今天讲造医生这件事情 ,在一定程度上说沟通是极其重要的 , 我是认同的 。

但我觉得今天的这个模型的呃 , 就是取决于说今天模型的真正的高水平的要求 ,在专业上我们是怎么强调都不为过的 。

嗯 ,因为医学它就是一个高信任 , 刚才我记得荣辉一开始提过 , 就是它的一个试错成本实在是太高了 。

所以所以换句话说 , 我们可以这么来理解这件事情 , 就是我们买一辆车 , 我觉得后面的这个体验的问题有点像车机系统 。

嗯 , 那前面的这个专业性有点像自动驾驶 。 嗯 , 所以你看这样的它两个产品在某种意义上之间 , 它对于一个团队的要求是一个啊逻辑性 , 然后包括它的稳定性的要求是不一样的 。

所以站在我的角度上说啊 , 呃 , 就是这么来看这件事 。 但是另外一个问题呢 , 就是什么叫做拟人吗 ?

像我们刚才叫拟专家 , 坦诚的讲 , 确实是今天模型 , 你看咱们回答知识有模有样的 ,但是我觉得今天模型想让它变成一个高水平的倾诉对象是很难的 。

就换句话说 , 今天做内科医生的难度远低于或者要做心理医生的难度 , 远高于做内科医生 。

嗯 , 这个是坦诚的讲 。 就是说所以我们在想说进一步的提升模型的共情能力 , 或者怎么去探索模型的共情能力 , 这件事情是很必要的 。

但我觉得这里面有几个难点 ,不仅是技术上的难点 , 一点就是如何评判一个人的共情能力 , 或者如何衡量一个模型的共情能力 , 这件事情是很不容易的 。

对 , 然后我们行内有句话 , 就是当一个指标能被测量的时候 , 那这个指标就可以被优化 。

Koji 杨远骋46:22

确实 。

王国鑫46:22

所以我们经经常谈说哎 , 这个你看 , 就咱们经常说 , 咱们经常现在看到很多这种所谓的 OMI 类的模型 , 就是它能模仿我的声音 , 然后我相信模仿我的声音特别简单 ,但我觉得如果做了一个呃 , 融会的数字人, 我觉得 Koji 可能前 5 分钟 、 前两三分钟给的感觉好 , 再过一段时间就觉得不像了 。

就是说就是说明那个那个感觉 , 就是那种所谓真正像的感觉 , 或者完全拟人的感觉 , 或者玩高水平的沟通这件事情 , 很有可能是需要花大的力气进一步的抬出的技术去支撑的 。

所以站在我的角度上说 , 对我来说是一个资源分配问题 。 我觉得今天的专业性的问题是不能 compromise,不能去影响它 ,但同时我尽可能的提升我的服务水平 。

当然我承认服务水平这件事情在技术上它还有现实的难点 。

Koji 杨远骋47:09

咱们有在做心理健康类的大模型吗 ?

王国鑫47:12

我们实际上考虑过做心理健康的大模型 , 实际上我们跟啊 , 国内的头部的心理健康的医院有过一些合作 , 然后啊 ,因为这也是一个北京科委支持的项目 , 大概可以简单说一下, 就是说它实际上就是一个心理健康的数字人, 背后前面的数字人和背后的模型都是我们研发的 , 然后它来去解决这个患者的焦虑和抑郁的这两种心理状态 ,是这么一个情况

。 但是这个临床实验还没有做完 , 然后但是目前来看临床表现的比较积极 , 这是第一点 。 第二点就是我们自己从模型的角度上看 , 我们并没有过分强调说它是一个心理模型 , 心理健康的模型 。

今天我们还在还在重点去解决常见病和重病这两件事情上还是偏多 ,在心理上我们投入的其实是略少 。

Koji 杨远骋47:59

了解 。

数据获取47:59

Koji 杨远骋47:59

那我们再说到就是前面其实我们提了好几次这个 , 就是你们的这个数据获取的这个点 ,其实在就是在你们昨天活动上也提到你们合作了那么多医院嘛 , 你们这些训练的数据都是通过一个什么样子的方式来得到的呀 ?

王国鑫48:16

呃 , 这个我可能不像 3D VAS 的不能说 , 我觉得我们这个能说哈 , 哈哈 , 哇 ,VAS 的 3D 啊 ,不好意思 。 然后我觉得我们数据来自于几点 , 第一点就是我们还是跟数据中心合作的比较多 , 这样的话因为数据就涉及到确权 , 通过数据中心的合作 , 一定程度上说能解决数据的合规的问题 。

因为医疗数据呢 , 它首先一定要强脱敏 , 然后强匿名化 , 这件事情呢 , 我认为放在就是外部比较好 , 就是不要放在内部 , 就是放在外部比较好 , 就是所有给我的数据 , 它本身就是高度匿名化和这个合规的了 。

所以我们跟数据中心的合作是第一道 。 然后最近也有一个大的签约吧 , 就是和一个国家级的数据中心进行一个合作 , 主要还是围绕着这个大的多模态模型的合作 , 这是我们第一方面 。

然后第二方面呢 , 我们的研发思路是这样的 , 就是说为什么要跟单单点的医院合作 , 我的研发思路是这样 , 就是我通过我们的互联网上的数据 ,以及京东健康本身的数据 ,以及合成数据 , 这是我的基线 。

然后我们通过大的数据中心的合作呢 , 构成了我一个 private data 的基线 , 就它是个 private, 它不是别人的 , 它是我跟它合作构成的 。

但是我相信通过数据中心 , 我能拿到尽可能省级的数据单元 , 大量的数据 。 然后我认为说在这个情况下呢 , 我可能把绝大部分的常见病都覆盖了 , 这是我的判断 。

第三件事情呢 , 我觉得很单点的顶级专科合作 ,因为他们手里有长周期的队列 , 那这个长周期的队列一定是偏疑难的 , 偏难的问题 , 那我就单点的跟他们合作 , 大概我们现在合作的家数大概十几家的这样的一个规模吧 , 我们单点跟他们合作 。

然后我的假设是我在一个大的模型上 ,在一个通过数据中心合作训练的医疗数据中心合作的训练的模型上, 我只要用不多的数据就能得到它的提升的能力 , 这是我的假设 , 这是我们一切的假设的开端 。

然后合规属性呢 , 上面的这部分数据呢 , 我们也是走单点的科研合作为主 ,也是通过数据中心脱敏的方式 , 三方脱敏的方式来去获得 , 然后走的一般都是科研知识协议 , 共同研发的科研知识协议来走吧 。

所以我相信绝大部分的医疗领域的公司都是未来都是这条路子 。

Koji 杨远骋50:24

然后前面其实提到咱们和一些这个医院有合作 , 然后现在医院对于咱们去做医疗大模型的 ,他们的态度呃 , 或者评价是什么呀 ?

他们有没有一些比如说担忧顾虑 , 还是他们就是非常积极支持啊 ? 这里尤其是有没有某一个医生或者某一个院长 ,他们给过你们一些让你印象深刻的反馈或评价 ?

王国鑫50:46

其实相反 , 我觉得其实挺支持 。 而且啊 ,Koji 我可以这么来讲 , 就是过去三年我一直跑医院 ,而这个支持力度是越来越大 。

可能最早的时候是部分院士从国家的角度他要去推动 , 然后未来到院长 , 现在我们看到了很多大的主任也有这个趋势 。

因为你想我们合作的这些医院 , 本质上讲它都有几个核心任务 , 第一个核心任务是学科建设 ,因为它已经是国家级的医疗中心了 , 那它就需要它有的责任 , 国家摆这个牌子给它 , 它的责任就是发展这个学科 。

那在这里面 AI 把它的能力固化 , 然后进一步的支撑它的学科建设是必然的 。 就我们刚才说医生培养是一个必然的事 , 对吧 , 所以他一定要参与这件事情 。

第二件事情呢 , 对他来说 ,他去服务患者 ,他想延伸自己的服务能力 , 想把自己的经验进一步的延伸 , 这个欲望是很强烈的 。

我们叫他欲望也好 , 或者他的历史责任也好 , 就是应该是这么一种很强烈的 , 所以他也很愿意跟你合作 。

第三点就是说 ,他实实在在的已经把 AI 应用到他的生产生活当中 。 今天的医生 , 实际上特别是一些年轻的主任 , 对于 AI 的认知实际上比我们高 。

我我们不要说具体的名字哈 , 就说我曾经建立过一个他是院士的学生 ,他也是很年轻很年轻的一个主任 , 然后他们对于 AI 能力的评测 ,他们对于不同模型的评测 , 不同模型的认知 ,在一定程度上说当时惊讶到我了 , 当时一定惊讶到我了 。

所以我们在看一个趋势 , 就是未来成长的这一批人, 就是优秀的医生 , 一定是广泛应用 AI 的工具来提升自己生产效率的这帮医生 。

然后当但是反过来说 , 就是当我们谈医生医院群体的时候 , 很多时候它不是一样的 , 它在人群内部是有巨大分化的 。

就我相信您肯定采访过很多不同的人 ,他对 AI 的观点是完全不一样的 。 所以我的一个直观体会 , 特别是今年去年年底到今年, 我感觉整个行业对于 AI 的认知已经变成说以前是说你不能犯错 , 今天的今天的认知是变成说我可以允许你犯错 ,但是我们要怎么协同可控 , 我们把哪一部分替代掉 , 哪一部分不替代掉 , 我们的场景如何进一步的落地

, 甚至来说说我们一起找场景 , 一起想办法 , 这种声音越来越多了 。 所以让我们觉得特别一方面感知就是特别感受很强烈 , 就是感受觉得很兴奋的同时也感到很多压力嘛 。

因为确实一旦到临床场景的时候 , 它的场景极其多变 , 这对你模型本身的泛化能力就要求进一步提升了 。

所以我我能这么回答您这个问题 。

Koji 杨远骋53:18

哎 , 那你刚说他们给你的这些反馈 , 比如说哪些地方大家可以一起做 , 哪些地方可以希望比较快的来被 AI 助力吧 ?

就他们的反馈比较集中在哪些领域啊 ?

王国鑫53:31

我觉得他们首先还是集中在几个领域 , 一个是患者服务领域 ,因为医生今天很多时候是看完病就完事了 ,其实他对于患者的用药跟踪和诊前的这部分 ,他们其实很希 ,他们其实也很需要一个类似服务机器人这么样一个这么一个产品 , 就是它能通过一个 AI 低成本的长周期的跟患者在一起 , 然后这样的方式才能进一步的提升患者被治愈的概率或者康复

的水平 。其实这是一个逻辑 , 很多时候医生做诊断只是一个决策 , 真的健康是掌握在我们个人手里的 , 很很多时候这么讲 。

所以医疗服务的只要涉及到医疗长周期的服务 , 或者叫这个医院它对医疗服务它有转型需求的 , 那么对于 AI 的诉求都是极大的 。

我觉得这是第一点 。 第二点我们叫科室级别的研究 , 科室研究水平 , 实际上就我们说了 , 今天这科室的研究水平和人员培养 , 这 AI 就是一个 must。

换句话说 ,以后医学院脑子中想的一定是我如何通过 AI 的能力尽可能降低人的学习成本和犯错概率 。 那只要是他这个有科室研究要求的医院 , 很多研究型医院给我们提的要求是能不能一起共建科研平台 , 能够共同的挖掘 , 自动化的挖掘 AI 课题 , 能不能把我的队列交给你去做 , 然后你能发现这种患者中的机会 , 患者新的疗法 , 那这是第二件 。

第二件事情 , 第三件事情是效率 , 就是这个医院的效率成压 , 就是对他来说 ,他也不能通过水平加人的方式 ,他的成本端啊 , 成本端的压力太大来去解决这个问题 , 那他就更需要这种所谓的诊前的助手或者是助理的方式来去存在 。

所以这种逻辑是进一步的存在 。 那当然现在有一种产品叫做医生分身了 , 某种程度上说医生分身的 , 就是他把第一点和第三点进行了个结合 , 用数字人的方式去呈现而已 。

但我觉得底层能力其实就是这三者 , 这三个场景是最多的 。

AI医院55:17

Koji 杨远骋55:17

咱们这一次同时还发布了另外一个产品 , 就是 AI 医院 1.0, 可不可以给大家介绍一下这是一个什么样的产品 ?

就对于啊 , 比如说我们的听众 , 对于一个这个普通的用户来说 ,他用 AI 医院 1.0,他可以得到哪些帮助和价值 ?

王国鑫55:33

其实我觉得这是一个特别朴素的观点 , 就是我们叫它 AI 医院 , 它可能是一个产品的 , 我们叫它一个名字吧 , 我觉得它就是个很朴素的观点 , 就是医疗服务它是一个专业属性强的 。

所以在我们的过去 , 实际上我们研究了很研发了很多这种 Agent, 比如说我们有专门的就像您说的一样心理医生 , 然后我们有内科 , 然后有不同的科室 , 然后有药师和营养师 。

当你有这么多 Agent 的时候 ,因为这个模型不一样 , 你在单点的 Agent 上说 , 你可以极大的优化它的表现嘛 , 对吧 , 那肯定是垂直的 Agent 是一个方向 。

当你当你有这么多 Agent 的时候 , 实际上我们脑子中在想说 , 我们是希望这些 Agent 散布在各地 , 然后让用户基于需求激发去找 , 还是应该说我放到一个产品中间 , 然后把它变成一种入口性质的产品 , 用户但凡有一点不舒服就会去找它 , 那这是后者是我们希望的 ,因为这样有用户心智 。

那接下来就在想说这个产品应该叫什么名字了 。 所以想来想去这么多专业的 Agent,是不是就是类似于一个人工智能医院的这么一个名字 ?

所以它很显见 , 它的逻辑很显见 , 它其实某种意义上说代表了京东健康去探索未来健康入口的 , 或者想争夺未来健康入口的这么一种心智吧 。

我觉得这个其实可以直接讲 , 就是这么一个逻辑 。

Koji 杨远骋56:48

未来健康的入口 。

王国鑫56:50

对 , 这是或者我们叫第一入口 , 可以用更强烈的词 , 哈哈哈 。

Koji 杨远骋56:54

我感觉它就是我模糊的感觉哈 , 我觉得这个产品它其实可有可能在两个方向上吧 , 一个是我觉得是 , 就比如说我们前面讲了很多是关于健康管理 , 就是对于在一线城市 , 可能现在对于医疗这个 , 就是对医疗这件事的认知是从一个看病到一个健康管理的这个转变的过程中, 就像前面讲的有很多案例 , 它比如说我去通过这种比较好的呃 , 就是医

疗服务 , 我给我自己的整个的一个健康情况做一个建档 , 从一个看病变成一个我要减少我有可能生病的这个可能 ,不是在管理我的健康 。

但是另外一方面其实是对更广大的用户来说 ,在一些比如说非一线城市 , 医疗需求缺口更大的这个地方 , 可能是一个对更多人来说 , 让他们来获取相对更优质一些的医疗资源的一个入口 。

王国鑫57:46

我完全认同您的观点 , 就是说当我们谈 AI 的时候 , 我觉得 AI 和移动互联网一个本质的区别 , 当然特别中国的移动互联网 , 本质区别是改变了我们和信息交互的方式 , 对吧 , 啊 , 虽然也有连接 , 比如说美团可能是物理世界的连接 , 滴滴是物理世界的连接 ,但总体是改变了我们和信息交互的方式 。

但我觉得 AI 从根子上, 它是一个更像是一个 B 端的生产力 。 我觉得虽然在国内谈 B 的时候有点有点有点不心感啊 ,有点不性感 ,但是但是它就是一个 B 端的影响力为主 。

所以我十分认同您的观点 , 我觉得未来的模式可能是这样 , 如果咱们再推演的话 , 就是大的医院或者国内大的医院其实是辐射地方 , 然后我们通过医疗体的方式啊 , 甚至兼并的方式辐射地方 , 这是第一点 。

第二点呢 , 这种越细粒子的地方 , 然后到社区级别呢 ,有大量的 AI 去辅助当地的医生 , 然后实现这种全科级别的筛查 、 分诊 、 问诊等等 , 然后通过重急症 , 然后通过转诊的方式这么来去做 。

而大的医院呢 ,不仅仅是诊断这么一件事了 , 它还有医疗服务的延伸 , 就不仅是做个手术就完事了 , 它有康复服务的延伸 。

而在这个过程中,AI 又能在里面承担着一个低成本的信息服务的能力 , 然后进一步的去连接当地有效的医疗资源 。

我我会我会认为说 , 如果偏要往中国未来的看 , 我觉得随着这个地域差距的加大 , 人口老龄化 , 大概率是这么一个方式啊 , 当然也会改变支付模式 , 支付模式 ,但是那个就不是我们今天的话题了 。

所以我觉得应该往后看 , 应该是这样的一个情况 。

Koji 杨远骋59:16

那你们会计划怎么样 , 它怎么样让它落地呢 ? 就让它更多的被这些非常需要它的人用到 , 或者是说可能都不只是你们的产品 ,而是就是说让更多的人能够通过 AI 来获得他很需要的这些信息 。

王国鑫59:33

我觉得这个问题可以这么来看 , 就是其实京东互联网医院本身就尝试着在做这么一件事情嘛 , 就是说啊 , 互联网医疗的底层逻辑还是呃 , 异地的医疗资源的匹配嘛 , 或者 7×24 小时的医疗资源的匹配 。

所以今天其实 AI 并没有说 ,也并不是它是一个一个新故事啊 ,并不是一个新故事 ,而是啊 ,在原有的这个医疗服务的故事或者的能力基础之上, 进一步的叠加它的能力而已啊 。

所以我在想 ,其实互联网医疗某种意义上说 , 就是 AI 的互联网医疗 , 就是在以原有的互联网形态上进一步提升 AI 能力得到的 , 大概是这么一个 。

Koji 杨远骋1:00:12

京医千寻这个模型是开源的 , 对吧 ? 然后可不可以讲一讲这个咱们开源了具体哪些部分 ,以及可不可以讲一讲这个为什么要开源 ?

王国鑫1:00:21

我觉得先回答另外一个问题 , 就是为什么要开源哈 , 就是我觉得逻辑挺简单的 , 就是医疗行业它是一个信任驱动的 , 它不是一个 , 我甚至不觉得它是一个合作驱动的 。

所以站在这个信任的角度上看啊 , 就是需要不断的啊 , 通过开源这种方式进一步的拉动你的生态合作伙伴参与其中, 这件事情是一个 must 的事情 。

所以我们对开源一直是持很开放的态度 , 就是说我通过开源能够让别人知道我的技术品牌 , 能够试用试用我知道模型的结果 , 然后进一步的反哺我的技术提升和我的那个生态能力 。

所以这么一件事情 。 第二件事就是我们开源相对比较比较比较充分吧 , 就是说除了模型本身的开源之外, 我们实际上把它的训练代码和一部分训练数据都开源了 。

我们的目的是希望参与者能够复现我们的工作 ,而不简简单单是说开源一个结果 , 然后去得到一个得到一个简单的结果吧 。

Koji 杨远骋1:01:17

开源其实抱着建立信任的这个目标嘛 , 然后开源之后你感觉这个目标实现的怎么样 ? 有没有收到一些什么样的来自开源社区的反馈或来自合作伙伴的反馈 ?

王国鑫1:01:27

其实我们主要还是来自于研究机构的反馈比较多 ,不论是大学还是医院的研究机构 ,因为我们模型开源的尺度也有大小嘛 , 所以一些小的尺度的模型 ,其实在医院的合作机构还有很多主动的评测 。

然后我觉得当时我印象最深的还是像我们今年能够不断的推进跟各个医院的专科合作啊 , 这个模型开源在里面其实发挥的重要性是比较高的 ,因为会让别人看到说你这个确实是在做事的一个团队 。

这件事情是我觉得这种信任合作的信任是一件啊无价的无价的一个过程 。 所以啊 , 确实有这么一个情况 , 主要当然主要还是来自于这个医院端和研究机构给我们的反馈比较多 。

Koji 杨远骋1:02:08

哎 ,其实你前面提到这个也是希望 ,也是希望这个产品能够占领用户的心智 ,其实我觉得也有可能这个考虑到越来 , 如果说越来越多的用户都用 ChatGPT 或者其他的这个这个 Chatbot 来询问这个医疗问题的话 , 那确实是对这个你们这个入口问题是有一个影响的 ,也可能也对整个公司的这个商业模式有一些冲击哈 。

那你们是比较期待这个不管是模型 , 从模型到你们这个 AI 医院 , 它对这个整它和它和你们的这个商业模式 ,其他的这些真正就是用最简单的话话来说 , 就是真正为公司挣钱的这些业务之间能够产生什么样子的联动吗 ?

王国鑫1:02:49

就是我自己在聊在谈 AI 的商业模式的时候啊 , 我觉得真正的有价值的是几点 。 第一点就是 100% 或者 3 个 9、4 个 9 的替代 , 这件事情是蛮重要的 , 就是你在能不能哪怕是一个很窄的窄域 , 你确实能够替代 , 那这件事情是蛮重要的 。

第二件事情是连接 , 就是今天的 AI 是不是一个更好的连接消费者和服务的纽带 。 所以因此在医疗领域 , 我觉得前者和后者都是有机会的 。

但如果刚才荣辉的那个问题是在于说我们今天的医疗模型 , 特别是跟京东健康的模式叠加的时候 , 那就得回到我们的那个整个集团的 slogan, 我们本身是一家供应链驱动的公司 。

就换句话说 , 就是我们的核心逻辑都是能够用最低的成本在市场上提供最优质的产品或者服务 , 那 AI 在这里面就有一个巨大的连接空间 。

所以对我们来说 , 就是类似这种入口型的产品 , 我自己的当然这不代表公司 ,不能完全代表公司 , 我自己的判断是京东健康一定要去争夺 , 一定要去推进 。

我们做虽然是作为一家互联网公司 ,但我们是有实体的医疗机构 , 我们有这种到家的服务能力 , 我们有我药品的供应链 , 我可以 30 分钟在很多城市可以 30 分钟免实现上门的服务和上门的送药 , 然后我有自己的体检中心 , 我有自己的医院 , 我们是这么一家实体 。

那在这个过程中,AI 就是一定要扮演好连接好后面的服务能力 , 为患者提供一套解决方案 , 然后这套解决方案最好是 for 他自己的 ,for 我们自己的 , 然后个性化定制的 。

所以这件事情就变成说它不变成说我今天要不要干 ,而是说我怎么干啊 , 怎么能把它做成的一个一个道理了 。

所以您刚才提到的观点特别对 , 就是未来的医疗服务的争夺一定会从这种单点的这种确实他们跟现在是竞对哈 ,其实我们的竞对 ,但是我的观点是会从这种单点的这种所谓的 Chatbot 的争夺或者单点入口型的争夺变成了 Chatbot 的体验或者能力 , 再叠加后端服务能力 , 二者通盘能不能给用户带来一个满意度吧 。

因为说到底医疗最终是靠有效性去活着的 。

Koji 杨远骋1:05:05

那在这个后端的服务这一块 , 你们现在有做什么要求 , 让这个后端的服务暂时不要影响前面的 Chatbot 里面的信息吗 ?

王国鑫1:05:15

啊 ,不会 ,其实我们把后端的服务更多原子化 , 比如说我举一个嗯不那么抽象的例子 , 比如说我我可以让护士上门给给一个患者做一次检检查 , 我们就这么 , 我们其实整个后端的服务已经被我们完全拆解到原子化了 。

那对于模型来说 , 今天要的是说它今天基于当期的判断 ,以及跟患者沟通之后它要不要做这件事情 ,以及做这件事情患者需要付费多少 ,以及患者的意愿度问题 。

我们今天模型这模型是解决信息这一侧的问题 , 当患者有意愿度了 ,也有这个需要 , 那我们只是调用后端的供应链去解决它的问题 。

所以我刚才讲的是说后面的这些供应链能力的夯实 , 它因为供应链它不仅仅简简单单是一个商品嘛 , 它还有服务嘛 , 这种能力的夯实是京东健康有可能去建这个心智的一个基础 。

如果我们连这个都没有的话 , 那我们就是完全飘在天上的一家公司 。 这是这是所以跟不同的竞队之间 , 大家手里有的核心资源或者核心心智是不一样的 。

而京东的核心心智就是在于这种服务能力是不是成本最高 、 效率最高的啊 , 成本最低 、 效率最高的是是不是这样子 。

如果是这样子的话 , 那接下来我们利于它的这种心智服务能力 , 那有没有可能做出入口型的产品 , 这是我自己在想的问题 。

当然所有 AI 的人今天应该都在想入口型产品的机会 , 虽然它很难 。

Koji 杨远骋1:06:34

那像其他的鸡毛公司 , 你觉得他们有可能基于就是这个在用户在 Chatbot 里面发起的这些问询 , 跟医疗方向有关 , 就就你了解 ,他们有可能去做一些延伸的一些什么事情或者产品或者服务吗 ?

王国鑫1:06:51

啊 , 实际上鸡毛公司对健康这个赛道是我觉得也是很关注的啊 , 然后当然我们不用提它具体的名字 , 就是说不同的公司实际上特别是一些 Chatbot,其实现在一些很大的 Chatbot 上是有一个很可观的流量占比 , 都是健康相关 。

这件事情其实是跟搜索当年的心智是很一致的 , 就是现在现在很多人其实把大的 Chatbot 还是当搜索用嘛 。

所以个人来说 , 对我来说 , 我觉得啊 ,他们肯定会从某种意义上讲 , 这是一个特别想做或者极其想做的赛道 。

那但是站在这个角度上看 , 就是还是回到我们一开始说的这个问题 , 就是说这个行业到底有没有门槛 , 然后以及它的商业化成熟度够不够高 。

所以因此这些大的通用的 Chatbot 对我们来说 , 我们更多把它当做合作伙伴 ,而不是竞争对手 。 这是第一点 。

第二点其实京东自己应该昨天的 GDD 也推出了自己的这个 , 就是通用的 Chatbot 吧 , 叫 Joy AI app, 对吧 , 叫叫叫这么一个这么一个 APP。

站在我的角度 , 我也我也当然也希望这个 APP 能够在市场上能够快速占领的这个一席之地 , 从而让我们集团内部形成产业协同啊 , 大概这么个情况 。

全球视野1:08:03

Koji 杨远骋1:08:03

然后 Nico 可以给我们讲一讲这个 AI 加医疗在可能更广的一个范围 , 就是比如说美国 、 欧洲跟中国相比 , 就是在这些领域你看到有哪些现在这个 AI 加医疗的一些 , 比如说不管是创新还是针对在解决不同问题 、 不同角度的一些产品做的比较好的一些例子 。其实比如说像美国叫 OpenEvidence,他们应该是这个不管是在融资还是收入方面 ,其实都取得还挺好的一些成绩的 。

王国鑫1:08:34

嗯 , 我觉得医疗 AI 这个东西呢 , 就是为什么海外和国内有时候大家可能啊看到很多案例 ,但它不见得像其他行业迁移性那么强啊 。

啊 , 这里面这里面关键的要素就是 payer, 就是支付逻辑的差异 ,以及医疗体制的区别 。 我觉得我们我们国内还是一个啊注重效率和公平的一个体制 。

所以虽然咱们今天讲看病难看病贵 , 坦诚的讲 , 如果咱是美国人的话 , 可能会更更艰艰难 , 艰难很多很多 。

所以您看从回回到这个角度上看 ,OE 的这种产品在美国在一定程度上能成为一个商业化产品的一个核心原因是医生的收入和医生的自我诉求 , 医生的高诉求 。

所以它是通过一个订阅费支撑的一个模式 。 那在国内的话 ,其实啊我觉得类似的生态是可以做 , 包括我们这次也把我们的寻证库开放了 ,但是我们的模式就是免费 ,也没有什么订阅费 , 你就大家随便用 , 就是说免费的模式 。

所以我会觉得这个就是局生淮北和淮南的问题吧 , 就是主要还是医疗模式的区别导致的支付逻辑的差异 , 从而导致不一样 。

但是我觉得有几个呃有有些产品我们还是可以深度的去看的 , 比如说美国现在实际上是有这种所谓的 AI 驱动的互联网医疗加特定化的啊医疗服务 , 特别化的用药服务的公司 , 然后比如说一些这种我们随便举一个例子哈 , 就是这种企业很多 , 比如说我们讲 HIMS HIMS 这家公司 , 它实际上就是一家让人变美 、 变让自己的变得漂亮 , 然后变美变变更

好的一家公司 。 它背后的实际上底层能力是在于说它有它的药品供应链 , 特别它有它自自身的这种特色的药品供应链 ,但它前端的获客和前端的服务都是在于说一个 AI 化的这种互联网的产品 , 从而不断的评估用户的状态 , 给他新的健康建议 。

回到了这个医疗的逻辑 , 都是在于说第一点就是你确实是可以服务医生 , 从而获得这个市场占有 。 这件事情上看 , 这个模式在美国是很通的 ,在中国可能要打一个问号 。

另一个就是服务患者 , 那服务患者的话 , 我觉得很多时候都要回到解决方案本身去倒推 。 很多时候医疗的解决方案还是器械 、 药品 , 甚至是某种生活模式的改变 。

那在这个前提下 ,其实就像刚才我们说 AI 可以为医院解决用户服务的问题 , 那么 AI 当然也可以为这个药企或者器械厂商 , 甚至是数字疗法的厂商解决用户服务的问题 。

所以是这么一种模式会比较好 。 那第三点呢 , 就是就是大家都知道的这种给医院端的这种服务模式了 。

目前在国内来看 , 信息化的渗透率已经比较高了 , 然后医院的采购啊 , 我理解也是一件长周期的事情 。其实我们也有智慧医疗的部门 , 我们也有一个京东卓一的产品啊 , 它力图就是想解决一个问题 , 就是把整个的医疗服务的信息化和患者服务的全部用 AI 改造一遍 。

所以这是第三个赛道 。 那最后一个赛道就是 2G 了 , 就是面对啊政府 , 然后解决医保端和管理端的问题 , 卫健委管理端的问题了 。

这在美国实际上相对要相对要少一点 , 相对这种模式相对要少一点 。 所以我来看说 , 如果从商业机会的角度 ,在中国可能最后还是得回到患者服务的这个赛道上去啊 , 我觉得相对来说更更更符合中国的土壤 。

Koji 杨远骋1:11:57

这 Nico 你刚才也讲嘛 , 就这三年你经常跑医院 , 大量的可能会沉浸式的在去思考 AI 加医疗可以怎么帮助大家变得更健康 。

健康建议1:12:07

Koji 杨远骋1:12:07

那这个如果回到这个一个比如说我们朋友聊天的状态啊 , 今天我们遇见了 , 然后我问你说 , 哎 , 你研究了那么多 AI, 研究了那么多医疗健康 , 现在你给我们一个建议 , 就我们要怎样能够在 AI 的帮助下让我们比如说过得更好 、 过得更健康 。

就是一些小的但是可行性比较高的 , 可能我们今天听众每个人听了都能够拿去用一用 , 就能够让自己变得更好的建议 , 能想到一些吗 ?

王国鑫1:12:34

我们讲长周期的健康有两个因素导致的 , 一个是个人的自身慢病的免疫力或者慢长篇病的表表现 , 另外一个就是自己的重症嘛 。

所以我觉得啊 , 特别是随着你的岁数的增长 , 然后在健康上进行 , 特别在健康的检查 、 检验检查或者健康的提前预防上, 要多投资这件事情一定是不会错的 。

咱们就以 35 岁举个例子哈 , 然后 35 岁之后, 我觉得每年都要拿出一部分固定的钱去投入到个人和家庭的这个健康的保护上去 。

然后不见得这笔钱有多大 ,但是你就要每年要拿出这笔预算 ,有意识的通过经济的手段去调整自己的认知 , 这件事情变得十分重要 。

而且从统计学的角度上看 , 它实际上是中期是为你省钱的 ,因为你你更早的发现 ,其实我们现在绝大部分疾病 , 甚至我们今天听到的很多重症 , 早期发现都是有治愈的可能的 。

所以啊 , 要积极的每年给出一部分预算 , 拿出这部分预算去寻找预算范围内最好的医疗服务啊 , 我觉得这件事情是对对人一定是有巨大帮助的 。

先把钱拿出来会推动你去做做事的 。

Koji 杨远骋1:13:47

对对对 , 我觉得这个非常有意思 , 就是不管怎么样 , 反正我这个钱先拿出来 , 然后再看看我怎么把这个钱花掉 , 这样就会倒逼我去研究这个钱我要怎么花 , 可以对我的健康有帮助 。

对 , 我觉得这个建议要比直接说大家都要去体检 、 都要去做胃肠镜 , 可能来的我觉得更有意思啊 , 就是钱先给出来 , 然后再去想办法必须花掉 , 花不掉的话年底就要这个给自己一个巨大的惩罚什么的 。

王国鑫1:14:12

对 , 当然不是每个人都适合做什么胃肠镜 , 我只是说以胃肠镜举个例子哈 ,因为比如说如果确实我来自于这个胃癌的高发地区的话 , 或者有家族史 , 那是可以的 。

如果不是呢 ,其实也没必要 ,但我我的逻辑就是啊 , 就是这样子是可能是一个很好的方法 ,因为健康它是其实挺反人性的 。

我们经常刚才我一开始说健康的需求是无限的 ,但是反过头来 , 好像只有你失去健康的时候它才有需求 , 所以也是很痛苦的 。

Koji 杨远骋1:14:38

对 , 刚问你说那 35 岁以下的人怎么办 ?

王国鑫1:14:42

啊 , 那我觉得道理是一样啊 ,因为我哈哈就是戏谑的说法是 35 岁 , 我觉得道理是一样的 , 尤其是关注自己的家族史 , 关注自己的状态 , 然后啊 , 我觉得有些工作是可以持续做的 , 比如说听上去很很可笑 ,但是呃 , 长期监控自己的血压 、 血糖 , 长期监控这种指标是很有帮助的 ,其实是对自己及早的发现 、 及早的干预 。

同样是糖尿病 , 我们现在好像国内大概一点几亿人糖尿病吧 , 理论上 10 个就有一个哈 。 同样是糖尿病 , 我早对早发现 、 早控制和我晚发现 、 晚控制 , 最终的结果都是差异很大的 。

所以就是还是要相信一句话 , 就很多疾病的优先发现在今天的科技水平下是有解法的 ,但是它一旦过了某些状态 , 它就没有解法了 , 它只有只有缓解的方法 。

Koji 杨远骋1:15:34

最后两个问题啊 , 然后因为我们今天聊了非常多医疗大模型嘛 ,但我相信其实我们听众很多其实并不是就是真的在从事医疗大模型的行业 , 大家可能是在做各种各样的垂直模型 。

经验投资1:15:45

Koji 杨远骋1:15:45

对 , 所以也想请教一下 Nico, 就在你看来 , 就医疗的垂直模型里面的一些经验 , 它要怎么可以迁移到其他的垂直模型 , 比如说金融 、 法律等等等等。

王国鑫1:15:56

我觉得这些其实大家的技术都是比较相通的 , 尤其是这个啊 , 我觉得所谓的这个行业经验 , 它的词我们叫做同源异构吧 , 就是说大家都是对一个更复杂的情境进行一个进行一个建模和优化 , 比如说教育我们个性化的学习路径 , 然后在法律上的这种啊 , 多信息流的这种多步推理 , 然后在金融上的这种投资组合的推荐 ,以及基于大量海量金融

数据的一个推理性的分析 。在这种角度上看 ,其实技术都是很相通的 。 这是为什么今天 AI 的人好像可以好像可以找到任何工作的原因吧 。

所以我觉得今天本质上讲 , 就是只要这个行业是高度意志类的数据 , 它的数据意志性比较强 , 同时它这个模型又需要融合推理去优化 , 然后那我觉得其实这件事情在医疗上所做的经验是很容易迁移到教育和金融和法律刚才您说的这三个行业 。

Koji 杨远骋1:16:50

那你如果今天你是一个投资人, 你要判断一个垂直大模型的公司能不能就是做得好 , 你会怎么判断 ?

比如说嗯 ,有哪些你自己特别在意的指标 ?

王国鑫1:17:03

嗯 , 我觉得一个事情就是这个行业的知识深度 , 就是说它的数据壁垒和知识深度 , 就是这件事情到底存不存在 。

很多垂域模型我觉得不见得真的 100% 存在 , 所以这是一个 0 和 1 的问题 。 然后第二件事就是看说它的商业机会 , 就是它的商业机会也不能那么大 ,因为一旦你商业机会大到大公司注意了 , 你也没戏了 。

所以它最好是它的商业机会有可能实现 ,在近期有可能实现 ,但是它相对来说又不是那么听上去让人那么宏大的故事 。

然后第三点就是这个公司它在它未来的这个商业落地的预期 , 就是它自己接下来是一个它机器这个模型 , 它是接下来是希望是一个 API 付费还是产品付费 , 甚至还是个销售驱动的付费 , 那要看它的合伙人里面那种商业的合伙人以及他的商业的思考吧 , 主要就看上面三项 。

Koji 杨远骋1:18:02

那今天谢谢 Nico 来做客十字路口 , 然后跟我们分享了很多他们做这个医疗大模型的一些经验 , 然后当然这个领域其实其实比较相对来说哈 , 我是一个非常有价值 ,但其实同时也其实是一个大家更多的人其实也是对它期待非常高 , 同时也比较敏感的一个领域 。

我们也期待看到 AI 能够让我们越来越多的人能够享受到这个由技术进步带来的医疗成果吧 。

谢谢 Nico 今天跟我们聊这么多 。

王国鑫1:18:30

谢谢 , 嗯 , 谢谢二位 , 二位拜拜 。

Koji 杨远骋1:18:37

如果你认为有朋友也会喜欢本期十字路口的内容 , 请转发微信推荐给他们 。 最后欢迎你加入十字路口的会员群 , 我们鼓励大家在群里聊天互动交朋友 , 寻找未来的同路人。