医学高端论坛
2020年01月号

应用人工智能辅助临床预测及决策

作者:贾玉华

天气预报,已成为人类常规使用的对大自然的预测工具。通过对历史数据的梳理建模,机器学习,超级运算,形成天气预报算法。当遍布太空(卫星)、地面、水上的检测器实时采集风、湿、压力数据,算法会实现对未来的气象给予精准的概率预测。但遗憾的是,我们目前除了适应气象及预防灾难,还没有办法改变天象。与此相同,生命科学期待可预测未来及转归的预报工具,与此不同,生命科学的精髓不单单是探索生命的内在规律,预测未来,还要应用科学手段,改变其自然规律、控制疾病、完善生命。让我们静下心来思考:基于通用模型设计的终极算法能否建立临床医学的“天气预报”,辅助临床决策,提高治疗方案的安全性,改善其有效性?能否建立解析健康、风险、疾病、康复的统一理论体系(unified theory)?中国有世界上最多的人口,有最多的病人,有最迫切的需求,中国医生应该如何利用前所未有的机遇,拥抱数据科学的核聚变,承担起这一历史责任?

一、医学天气预报系统
“如果有一个像天气预报一样的系统,可以预测治疗方案的转归概率,您会参考吗?”,对于这一问题,绝大多数的与会专家显示出了积极的态度,其中将近一半(49%)的与会专家选择了A,表示“很期望,会作为临床决策的辅助工具”;46%的与会专家选择了B“会尝试,参与临床验证”,只有3%和2%的专家表示怀疑或者不接受。

针对投票结果,主持人肖飞教授邀请陈香美院士、许嘉齐教授、温利明教授(澳大利亚)、曾小峰教授、赵岩教授和张志毅教授分别发言,分别阐述了他们各自的观点。

陈香美院士:

对于这个问题,我的回答应该是选项A“很期望”。天气预报现在我们每个人都在看,大家一打开电视或者手机,都会关注最近的天气。尤其是要到哪去的时候,好比我今天是从长春到上海,那我就关心这两个地方的天气。一个是将近零下15度(长春),一个是零上15度(上海),两地的气温相差30度。这个预报的结果,虽然还不能说特别准确,但是基本上是很概括的,包含在这个范围内,能起到提示的作用。

在诊断方面的辅助,如果大数据人工智能将来会像天气预报一样,能够帮助我们临床医生去判断疾病,提示疾病发生的程度,预测将来的愈后如何?这一点我还是相信的。

至于疾病的治疗方面,我不是很相信,担心过于相信人工智能之后,会倒向另外一面。任何一个机器也好,人工智能也好,都代替不了我们的人脑,它只能是做一个辅助性的诊断,我是这么想的。

曾小峰教授:

有可能,这个可能叫做没有最好,只有更好。所以说这种辅助只是在这一阶段,可能它也会在不断的进步,这个系统应该是在随着时代的发展不断进步,我相信这个系统很快会出现,只是时间早晚的事。当然这个系统它会永远在路上,没有最好,只有更好,我相信这是社会发展的趋势。

因为现在科技发展得太迅速了,在几年前,我记得在五六年前我开始讲大数据的时候,很多人都认为是忽悠,你看看,将来可能在两三年左右就出现一些变革,甚至十年之内就会发生一次观念性的变化。所以我觉得时代发展很快,让我猜测,我很难猜测。我们现在大家所有人都在拿手机,而有人预测在五年以后手机将消失。

许嘉齐教授:

我认为需要迫切加快研发投入,加快工作进程。从AI技术的发展趋势来看,实际上这已经是人类在AI技术上的第三次兴起,前两次的失败都在于我们技术不够成熟。第一阶段,信息技术解决了记忆的问题;第二阶段,能够解决人类感知的问题;现在到了第三个阶段,AI技术解决的是认知技术的问题。

可以说现在我们真正开始进入到了认知革命的阶段。认知包括了大数据对一个具体病人病情的理解、对病情的洞察、对病情的推理、对病情的分析、计划和决策,提供出来相应的一些方法,这些都是基于大数据。

将来到第四个层次,就要有在认知的基础上更高一层地进一步学习。实际上AI现在已经放进去了很多学习的相应内容,如果是一个好的系统,它需要不断地完善一些相应的数据进去,让评估的体系更加成熟、更加准确。一直到第五个层次,人们认为这是一个智慧的层次。如刚才陈院士所讲,我非常赞同:这个智慧的层次永远是在人的脑子当中,机器永远是辅助于人的。我认为现在随着技术的完善,我们需要大量的医生投入到实际的工作当中,解放我们沉淀在医院里面的无数数据,让这些数据变成生产力,是当务之急。

主持人肖飞教授:

这就是我一直讲的:希望核聚变的发生。温教授,作为一位流行病学专家和健康专家,您对此有什么看法?

温利明教授:

温利明教授:我是搞公共卫生工作的,当然预测模型就是我的工作。通常讲预测的时候,都会有一个结果,还有一个可信区间。也就是说,因为没有办去无穷尽地预测到一个极限值,也就是模型无法包罗万象,把所有的因素都囊括在里面。如果遗漏了某些因素,也没有办法去进行100%的预测。当然,即便如此,这个预测模型,也会帮助我们的临床诊断。

另外,我还想把这个问题引申开来讨论,不只是讲天气预报,比如说地震检测。这么多年了,我们到现在还没办法准确地预测地震。另外,还有火山爆发的预测。上周,我有位新西兰的朋友过来,提到预测火山爆发(编者注:当地时间2019年12月9日下午,新西兰怀特岛发生火山爆发灾害,当时岛上共有四十余人,截至发稿时,已有19人因灾死亡)。大家都说,这个是一个活火山口,都在预测某一天可能会爆发,但就是没有办法去准确推算。那就只能反过来说,这是一个无穷尽的预测,没有办法找到一个终极的模型,确实很难。

主持人肖飞教授:

社会科学和医学,还有政治和经济学,都和物理化学不一样,因为影响因素太多。物理的公式多简单,E=mc2,就解释了整个的物质质量和能量的变化。但就是刚才温教授所提到的那个火山爆发,也是因为有了警告,提高了大家的警惕性,才没有几万人在岛上,就只有四十多位游客,控制住了损伤和死亡人数。

对此,赵主任您有什么样的观点?

赵岩教授:

我同意很多专家的想法,肯定是选A。我举个很简单的例子,在我当年上大学的时候,学习心电图,连心率都要自己数,还要靠人眼去判断有没有房早、室早和其他异常,间歇长短,都要用量尺去量。但现在的心电图,直接就能给出结论:比如这个人是否有室早、房早?心率多少?有一次,我听心血管科医生在讲课的时候提到,现在有些人机联合的传输设备,不仅能告诉你出现了什么情况,在急救的时候,还可以建议你首选什么药,到附近的药店拿一下,后面再关心什么,一步一步都已经在往前走了,所以这肯定是趋势。另外一点,我觉得人脑就是一台最好的电脑。

张志毅教授:

人跟动物的区别,就是从智商和抽象思维上,摆脱了动物的层面。但是人的大脑毕竟还有很多的局限,所以人脑又发明了当今的电脑和人工智能。人工智能的作用,在某种情况下一定要超过人的智商。所以如果有天气预报这样的一个系统来预测疾病,一定是我们所期待的。但是刚才几位专家也谈过,尽管天气预报能够预报天气,但它也有不准的时候,不能穷尽。影响因素太多,但至少它能给我们提供一个方向。人工智能一定要跟大脑结合起来,未来在疾病的预测、诊断和治疗上,能发挥很大的作用。比如说防病,光想着治病,是治不过来的,要通过各种危险因素来进行预测,提供一种统一的共性方法,来进行防病,这样无论在诊断上还是治疗上,一定会事半功倍,对医学起到极大的推动作用。

主持人肖飞教授:

有人说再好的机器都没有同理心,在判断的时候都很机械,但是它有客观性,它可以来补充纠正我们的惯性思维。刚才赵教授讲了心电图的例子,我看过一项非常好的研究就是用来分析心电图的,通过人工智能分析来发现高血钾。过去传统都是看ST段或者是T波,把其他数据忽略掉了。后来,研究人员把整个心电图的数据段全部输入进去,最后94%以上能判断出高血钾,特别是透析病人。所以说,大数据做了补充。

二、慢病共同规律 vs个性化治疗

张志毅教授:

在某种程度来说,医学也是一门哲学,是一个辩证法。看病都是一样的,从个性当中找共性,从共性当中找个性,相辅相成。同样,疾病也一样,无论个体还是人群,它一定是在共性当中有个性。所谓的共性,就是一个共同的规律;个性,是要采取个体化的治疗。任何一个疾病治疗,都有常规治疗,在此基础上再采用个体化的治疗方案,所以是相辅相成的。

赵岩教授:

我是A、B、C、D都选,因为这个规律很简单,我是风湿科的大夫,举一些风湿科的例子。比如说殊途同归(选项A),有个病很简单,原发性胆汁性肝硬化,简称PBC,不管什么样的肝脏的损伤,无论是乙型病毒性肝炎(HBV),或者酒精肝,或者自身免疫性肝炎,到最后都是殊途同归,到肝硬化,我们大能理解。相辅相成(选项B)的例子太多了,我就不举了。分道扬镳的(选项C)也有,比如红斑狼疮和类风湿关节炎,都是从自身的免疫异常起病,但是最后的表现完全是分道扬镳的。比如说相互矛盾(选项D)的,也有,我们今天上午讨论了这么多TNF-α抗体的问题,TNF-α抗体,比如对肉芽肿的作用就是相互矛盾的。用于治疗肉芽肿疾病的时候,比如克罗恩病,它是好的一面。但是,往往治疗克罗恩病效果好的这些药物,又会破坏潜在结核的肉芽肿,所以往往结核的发生率也高。所以说,我觉得人的疾病太复杂。

温利明教授:

我的选择也是相辅相成。但是我想把有关慢病的共同规律推广一下,从公共卫生的角度来讲,慢病的共同规律,到最后是社会经济地位很重要。为什么这么讲?因为我们发现,在公共卫生领域,很多疾病,为什么在某个特殊人群中容易发生?这就和他们的收入和职业有关。

对我们来说,慢病里面一个共同的规律要注意,就是人群的规律。特别是刚才曲伸教授讲的,我很欣赏:在给患者看病的时候,我们问病史时,病历里面,第一句你就会问患者的年龄、性别、职业和生活习惯,这些都有可能会影响到其疾病的发生。

陈香美院士:

我也同意大家的意见,主要还是相辅相成的。疾病的共同规律确实有很多,在公共卫生方面,好比说代谢性疾病,如代谢综合征、糖尿病等,确实是与群体的医学科普素养的高低有直接的关系,所以这也是一个共同的规律。因为医学素养高的一些民众,可能比较注意饮食和周围的环境,所以这些人虽然也可能发生代谢综合征,但是不会那么严重。

精准医学必须要在疾病共同规律的基础之上,再结合个体化。如果每一个疾病都去找精准医学的个性化,这可能是基础医学专家比较期待的,但有些不太现实。所以精准医学的理念提出了好几年,虽然推进了临床医生对个性化治疗的认识,但是在全世界范围内,在治疗方面,精准医学几乎还停滞在一个相对比较滞后的水平。所以,我认为ABCD都有,但是可能以B为主,应该是相辅相成的。

主持人肖飞教授:

关于“精准医学”的理念,2011年第三届《康复•生命新知》医学高端论坛在中国首次提出了这一理念。曾教授你怎么理解这个问题?从风湿科的角度,从大医学的角度。

曾小峰教授:

我觉得也是相辅相成。我觉得不单纯是慢性疾病,所有疾病可能都有它的共同规律。刚刚陈院士讲得非常对,个性化治疗一定要建立在共有的基础上。就像我们现在发表的诊疗指南,就是一个共性的指南。但有些人说你这个指南根本不适合我,我治病就不用指南,全都用“个性化的治疗”。那这就违背了矛盾的普遍性和矛盾的特殊性的关系。实际上,我觉得共同规律跟个性化治疗,就是矛盾的普遍性和矛盾的特殊性。矛盾的特殊性一定是在矛盾的普遍性里面,它首先是在普遍性不适应的时候,才出来了它的特殊性。所以我们在治疗的情况下,首先应该按照指南来治疗,这才是共同规律的治疗;当然,有些不符合的,可以再考虑个性化治疗。但不能说指南的治疗方案都不采纳,直接去用偏方或者是什么其他的方法,我觉得这就是一个错误。

主持人肖飞教授:

大家都是在从哲学的角度来讨论这个问题,我们都认真地学习过矛盾论、辩证法,这些思路应用在临床角度,会非常有帮助。实际上一位优秀的医生,一定是哲学家、科学家、艺术家,还要是社会活动家。这几个“家”,结合在一起,确实很难做到,对医生的要求很高。

现在的精准医学,是因为有几个抗肿瘤药物,做了分子通路的划分,给疾病重新分了类。不再是按部位来命名,比如肺癌、结肠癌,而是按照一些通路,比如说AKT通路。关于精准医学和疾病的共同规律,许教授,从药审的角度,您怎么看?

许嘉齐教授:

我们正在经历着一场医学范式的变革。过去,我们对分子和基因跟疾病相关联的方法上是认知不足的,如今我们知道它们跟相关疾病紧密相连。在整个的治疗体系,治疗学上,正在发生着改变,指导着未来的模式。

现在的治疗,我们有大的总的原则、共识、指南。当到具体的病人的时候,一定是在共性和个性这两个方面相结合。任何一个指南,任何一个共识,都不可能包罗万象,把每一个病人具体的情况都写到那么精准,这个时候是医疗如何利用指南?如何在面对具体病人的时候,把精准医疗跟具体的疾病结合?

举个例子,比如说现在广谱的抗肿瘤药物,它可以针对某个基因突变,可能既在肺、又在肝、又在肾,但是这些病人本身的基础疾病并不相同。但基础疾病跟患者的肿瘤,究竟是什么样的关系?如何来应用这种广谱抗肿瘤药物?从药品审评的角度来讲,实际上还有很多数据并没有纳入。
所以,一个说明书,一个指南,提供给医生的也仅仅是在某一个方面,医生永远不可替代,他一定是从一个病人的整体的角度来考虑问题。

主持人肖飞教授:

指南和说明书都是随机对照研究(RCT),是在一个理想的世界中做出来的数据,它的适用范围是有限的,只能解决一部分的问题,或者一般的问题,还有很多留待临床医生去总结,去积累数据。

三、中国医生可以引领世界医学

主持人肖飞教授:

许教授,您接触过美国的FDA,接触过全世界的药审部门,您觉得中国能引领世界医学吗?

许嘉齐教授:

恕我直言,我觉得我们现在不要再喊去引领什么,我们需要踏踏实实地做好每一件事情。人类的健康是每一个国家、每一个医生去奋斗,去奉献自己的一份知识,去完成全球疾病治理,这应该是一个比较好的一种做法。病人多不是一个光彩的事;医生多我们可以挺自豪,但是我们只是总数多,我们人均医生是不是真的多?我们还得要回到一个医生到底管多少病人上来讲;要说到数据的合理利用、采集,科学的合作精神,那我们更有很多工作需要做。所以,我想我们需要坚定信心、奉献更多、努力更多。

主持人肖飞教授:

曾教授,您有什么样的观点?

曾小峰教授:

我很同意许教授的观点。我认为是可以引领,但是目前还没有。我觉得引领不是因为中国的病人多、中国的医生多这些原因。中国的病人多,恰恰说明是不好的,并不是说病人多就会引领,而我们中国医生的智慧,将会引领。

实际上我们医生并不多。在风湿免疫科,我们一直在说缺医少药,我们在推动这个学科的建设。卫健委刚发文,要求三级医院要建风湿免疫科,我们的医生并不多。所以说我认为将来中国的医生是可以引领世界的,但并不是因为这几点。

主持人肖飞教授:

陈院士,您是最高学术权威机构的代表,中国工程院的院士。您从国家战略上,看我们什么时候能够引领?

陈香美院士:

我相信中国终究有一天是会引领的,这是我们的终极理想和目标。但是现在有几个问题,第一个,中国的病人和人口数的比例还不是很准确,因为我们现在发布的流行病学数据要慎重地去思考,因为流行病学是在某一个抽样调查,或者某一个区域,在某一个时代所发生的。如果按照现在流行病学公布的数据,看起来一个病人要有多种疾病缠身。当然我们国家已经进入到老龄化社会,65岁以上的老年人有几种疾病合为一体,我是相信的,但是我们的青少年并没有。

所以我希望国家疾控中心,应该重新考虑流行病学调查,国家计划里面应该拿出更多的经费,去支持准确的流行病学调查。要不然的话,真的以为我们是一个疾病大国,还引以为傲,这是不应该的。这说明我们的预防做得不好,治未病方面做得很差。准确的流行病学数据是首先要做到的。比如说“乙肝大国”,这些当时提出的数据,我们不能否认当时那个时代的调查数据,但现在时过境迁,现在乙肝又有多少?实际上我们可以说,40岁以下的乙肝病人几乎已经没有了,尤其是在中国的发达地区。所以,这些流行病学数据,在不同年龄层,它的数据是不准确的。

但是我们国家的科学家、临床医学家,为了申请一个项目,就刻意去夸大这一部分,就像说中国这个技术也是“卡脖子”的,那个也是“卡脖子”的,等到报国家奖的时候,肯定说我已经解决了“卡脖子”技术,回头他有一份项目建议书给中央说,我要解决这个“卡脖子”技术,正好是他报奖的,已经解决了这个“卡脖子”。所以我们还是脚踏实地的,实实在在的,不能有半点虚的学术作风。

至于大数据,我相信中国医生的智慧和AI领域等多学科的合作,会有走在国际前沿的可能,因为我们现在起跑线基本上是一致的,中国又有这么大量的数据。当然,如果一个住院医生、一个主治医生一天看100个病人,最后他手上等于没病人,没经验!因为他顾不上去整理,每天看到就头昏脑胀,哪能去整理这100个病人呢?而如果一个医生一天看10个病人,那就是真正的经验,他能够背下来这10个病人。所以,中国医生是世界上最优秀的医生,任劳任怨,每天要看这么多病人。在目前的医疗体制下,中国的病人是想找谁看就找谁看,而且马上就要看,不看就要闹。

我很赞赏用大数据去解决问题。为什么我这么忙也要赶来?因为肖飞他们在这方面做得很好,尤其对疾病数据智能化的处理。让病人自我管理,这也是大数据的一部分,我们也在合作做一些IgA肾病的数据科学,但肾脏病比较难。

总的来讲,我们的临床医生优秀,但是他没有时间去整理数据,他可能是让一些下面的人去整理,那么这个数据来源就不准确,你想想产生的人工智能会准确吗?所以这些问题都是在我们前进过程中不断完善和改变的一些部分,但我们要有一个目标,相信这些是会实现的。

主持人肖飞教授:

确实是,如果没有准确的基础数据,做决策就会被误导。美国也没有特别好的数据,他们的电子病历好多都是复制粘贴的。还有韩国和日本的医生,也只是用两三分钟的时间看病人,这确实是通病。赵教授,您有什么补充?

赵岩教授:

肯定大方向跟大家都一样,我们会自信的,但是我觉得这个自信不能让我们迷惑自己。举两个例子,一个是有些数据可能误导了我们,比如说我们这几年确实发展得很快,但是要想到我们前面是一张白纸。比如说狼疮患者,大家都觉得这几年狼疮患者的存活率提高了,但是如果再跟50年前相比的话,狼疮患者这么多年和正常人的寿命之间的差距不是在缩小,而是在扩大。是因为和50年前相比,大家整体都上来了,所以要从不同的角度去看,才不会被迷惑。

第二个例子,来看看类风湿关节炎治疗的大分子靶向药物,比如说,2020年,一个靶向药“修美乐”的专利到期了,一下子冒出来十几个仿制药。但是,这几年,我们国内有一个原研药出来吗?这一道门槛如何跨过去? 我觉得要有自信,但是要客观看我们自己,不要被迷惑了。

张志毅教授:

作为中国人,信心要有,但是路还很长。我觉得,目前还处于一个科学浮躁的年代,无论科学精神还是合作精神,都有待于进一步提高。所以对于数据的采集和合理的应用,风湿病学界也就是这几年在曾小峰主委的带领下,才提到大数据上。这个工作才刚刚开始,但未来的路还有很长。中国医生多,这是相对的,中国人本来就多,这么大的一个人口基数,医生自然就多,但相对于病人来说,医生数就少得可怜。

陈香美院士:

提到这个话题,我补充一下,如果按照人口数来计算的话,中国的医生根本就不多。我们现在将近14亿人口,注册医生100多万,不到200万;再加上助理的注册医生,一共加起来360多万。但你用14亿人口去除一下,医生的比例是比较低的,和我们国家经济发展是不相符合的。(编者注:2019年4月发布的《国务院关于医师队伍管理情况和执业医师实施情况的报告》中显示,截至2018年底,我国医师数量为360.7万,年诊疗人次数83.1亿,支撑起世界上最大的医疗卫生服务体系。每千人口中医生数量为2.59人,在全世界范围内排名靠后。)

张志毅教授:

医生目前相对较少,还有很多原因,比如说,有些医生都改行了,在干别的工作。在座的至少有20位原来都是医生,现在已经从事其他的工作。我们国家的病人很多,需要更多的医生。

主持人肖飞教授:

是的,病人数量越来越多,有很多客观原因,一方面是因为诊断水平提高了,疾病分类提高了,以前无法确诊的疾病现在得到了诊断;还有一个原因是人口的老龄化,寿命长了,得病的整个周期也就延长了,看上去好像病人多了。如果按照达尔文的进化论来看,就是优胜劣汰,适者生存。以前医学不发达的时候,人如果在年轻的时候得了疟疾,一半的可能性就会死掉。但是到了老年,这个进化论就不太适用了,环境已经没有办法影响他的寿命了。但是人衰老了,就会有新的病出来,这是要我们思考的。

四、中国医学在哪些领域可引领世界?

许嘉齐教授:

改革开放以来,应该说中国的医学有了极大的进步。但是如刚才各位专家所讲,我们是在一个过去被封锁、在计划经济的条件下,从一穷二白发展起来。那么想要说未来我们在哪一个领域可以发展的快一些,可以让全球认可,说中国引领,我觉得4个方面皆有可能,但是最现实的话,我认为大数据和人工智能的这一个领域可能更接近于国际水平。我们在这个领域当中投入更多的资源,设计更好的制度,创造更好的环境,就完全有可能去创造一种新的发展方式,快速前进。

这些年在改革发展的过程中,药物的研发及产业化也在进步。刚才有专家讲到创新的药物很少,确实如此,但这两年也有喜人的进步。2018年底,罗沙司他,在中国率先获批上市,从中国走向世界。(编者注:罗沙司他,可促进内源性促红细胞生成素表达和铁的吸收、利用,有效改善贫血症状,被批准用于治疗正在接受透析治疗的患者因慢性肾脏病引起的贫血,是全球首个利用低氧诱导因子原理开发的肾性贫血治疗创新药。)

像罗沙司他这样“first in class,best in class,only class”的药物,都在后续的管线上在研究。首先说环境,这么多年的改革下来,国家努力创造了一个鼓励创新的好环境;资金,全球的投资基金大幅增长,投入到中国的药物研发当中,增长规模达上万亿;人才,我国的科技千人计划,总计7千多人中,大约有2千多人是涉及到健康领域千人计划的专家。所以人才、环境、资金,都已经具备,我们确实到了一个跟全球发展平行的、能够快速增长的时候,所以对未来应该充满信心。

曾小峰教授:

实际上,A、B、C、D我们都有可能引领,但是我们最快能够实现引领的,我觉得大数据跟人工智能可能是我们现在跟国外差距不大,我们能够实现弯道超车的一个方向。当然我觉得我们在临床,在药物研发方面也是很有优势的,这完全可能,但是我觉得目前要想很快超越引领,还有很大的差距。现在我们唯一觉得比较接近的,就是大数据跟人工智能,因为我们跟国外几乎差不多,差距比较少,起步不算太晚,所以我觉得在这个领域最有可能引领。

陈香美院士:

我和大家的意见一样,这四个方面都有可能引领,但是就好比A选项,药物的研发和产业化,这完全是有可能的,但可能只是在某些药物的研发方面。因为重大新药创制专项,国家做了非常大的投入,按照咱们国家的GDP增长的速度,和对重大新药创制的投入,那么药物研发的土壤现在已经比较肥沃了,我相信陆续会有一些新药产生的。

当然,产生一个新药,马上大家会有一些争议,所以大家老说,在各个行业里面,我们医药卫生行业是批评与自我批评最热烈的——马上就自我批评,哪儿不合适。我们卫生行业自我批评、互相批评,自律性很高。所以说氛围很重要,我们应该支持新型的药物,当然任何一个药物的产生,任何一个新生事物都不会是完美的,那我们都要去包容,去不断改良,再评价,再改良。

B选项,临床治疗,也是这样的。在临床医疗的某些领域,外科的很多手术都能引领世界。比如说在座的沈锋教授,他们东方肝胆医院的肝脏手术,绝对是在全世界做得最好的。但从整体上来看,我还是非常同意我们最可能引领世界的是D选项,大数据和人工智能领域。但是顶层设计非常重要,不能一窝蜂,不能把大数据做滥。怎么能够把顶层设计做好?把数据的准确性把握好?然后和AI等多学科整合,不要急于去产生一个人工智能,然后在临床评价以后让临床医生非常之失望,那么对整个领域就是一个否定的态度,如何去对待这些,是非常重要的。

C选项,基础医学领域,也是有可能的。像蛋白质组学、肝脏蛋白质组学,贺福初院士应该在全世界是做的最好的。但从整体上看,我们现在能够快速引领的,因为起跑线是和国际上一样的,是大数据和人工智能。

2010年开始,我们在时任卫生部陈竺部长的领导下,做了一个透析登记的数据库。当时还不知道叫大数据,反正就想摸一下中国有多少透析病人,多少尿毒症病人,需要建多少透析室,卫生部是从这个角度考虑问题。经过10年数据积累,到目前为止,正在血液透析和腹膜透析的病人总计70万,这个数据是比较准确的。但是这个数据怎么能够利用好,变成人工智能去预测尿毒症患者的早期干预措施,或者延缓他走向尿毒症,或者他并发症的出现等等,还需要考虑。

刚才许教授讲了,罗沙司他,就是治疗肾性贫血的一个药物,其实它是在北京的产业园产生,但它的研制是在国外做了很多的前期研究。我们还是希望大家都有信心,要包容,要支撑我们国家任何一个方面的发展和进步。

主持人肖飞教授:

陈院士讲的道理非常深刻,就是说我们的大数据不能急。在数据科学上有一个说法,叫做“Garbage in, Garbage out.” 意思是说:如果是垃圾进去,就永远变不成金子,出来的还是垃圾,所以我们还是要讲数据的质量。

陈香美院士:

对,讲到大数据,不但要有人来采集数据。还有一个,实际上我们已经领先了——在数据的运算方面,连续这几年,我们大数据的计算速度都领先国际。

温利明教授:确实是,中国的大数据运算能力,是世界第一的。再一个,假如说到大数据,就要涉及数据传送,为什么5G打得那么凶?就是因为中国已经在这个方面领先了。

赵岩教授:

实际上在人工智能和大数据领域,我们在某些方面已经领先。这两年的中美贸易战,美国人为什么掐华为?大家都很明白,就是因为我们在某些方面已经超过它了。中国有独特的优势:我们有这么广大的应用市场;我们还有一个很重要的——国家政策的支持;更重要的是,中国能够形成产业人才的最大基地。我们每年培养的计算机、数学的工程师是全世界第一,这是最重要的一点!

主持人肖飞教授:

而且还有一个,就是病人愿意去分享数据。其实要特别感谢我们中国的病人,他们拥有数据,他们也愿意分享数据,最后让我们的医学能进步。回过头来,通过科学的努力,让病人成为最大的获益者,实现价值。我们应该感谢广大的病人,是他们分享和牺牲的精神,在推动科学的进步。

张志毅教授:

我和大家意见一样,因为现在有几个优势——第一,大家意识到它的重要性;第二,国家的支持和重视程度;第三就是我们有这么多的医疗资源。但是需要注意的,就是科学性和规范性极其重要。从顶层设计做好,不要产生科技垃圾,一个垃圾进去,整个就都是垃圾。所以怎么保证科学性,是最重要的。

五、临床思维方法

张志毅教授:

我个人看病的一种模式,就是A,尽管大家选得很少。对于一位资深的、有经验的医生,要有这样的能力,病都是看出来的,不是化验出来的。但是为什么还要去化验?就是找各种证据去支持。一般情况下去出门诊,我们给一个病人做诊断,要理论知识、临床经验,再加上辅助检查相结合。实际上,当一个病人到你的诊室以后,经过你看他男的、女的,多大年龄、起病形式、治疗反应,在这种情况下,我们几乎对这个病就有一个判断了。

有一些患者,比如说类风湿关节炎,根据经验,医生判断患者是这个疾病,有可能化验结果显示类风湿因子阴性,CCP阴性,但其实整体来看,患者还是可以诊断为类风湿关节炎,因为其他方面的表现都符合。任何检查都存在一定的敏感性和特异性,会存在假阳性、假阴性的情况,所以不能单纯去看检查结果,要综合来评判。这样下来,准确率应该在百分之七八十左右。

赵岩教授:

我在想,我这个礼拜看的病人,是哪种情况?我感觉,我大部分的病人,答案中的这几种都不是。大部分的病人,我可能就是下意识去做判断。但是我必须看到病人本人,如果电话咨询我,我就给不出答案。有的病人,看到本人,简单聊几句,基本上就差不多了。但是如果有疑问的病人,我的思维一般是从C开始,用排除法说服自己。

温利明教授:

我想把这个问题引申开来,也就是方法论的问题。通常我们中国人讲先入为主,你看到一个问题,先设想最可能的,然后去找证据。所以这个问题,我选的是B。

陈香美院士:

在诊断过程中,根据医生的级别不同,可能会有不同的考虑,做出的选择也不完全一样。比如说有经验的医生,也就是说高明的医生,自己基本上是设定了一些想法,再去经过化验或者是辅助检查验证。而一个初级医生,来了一个病人,他肯定要想这到底是什么病?这也是为什么我们临床医学是经验医学的原因。

当然经验不是单纯靠每天去多看病人积累的,必须要有科学的思维去进行经验积累,才能够做一个很好的医生。所以,我认为这个问题跟医生本身的经验、年资等都有关系,不能一概而论。

当然,我们应该向国外比如欧美学习,他们从小的教育就是先去尝试,任何事情都去尝试,中国的教育基本还是应试教育,所以从小的模式就是按照固定的模式去思考,这一点也是临床医生不能很好地创新的原因,和从小的教育模式有关。但是中国的医生手巧、有智慧,心算也好,这也是一个优势,真的是多年来我们的文化背景所导致的。

将来想做一个创新型的临床医生,还是要从小培养。我们改变不了初高中的教育,我们应该改变医学的教育,目前的医学教育,还不能够培养更多的优秀学生。有个不太乐观的趋势,就是现在很多90后的学生,在住院医生培训阶段,会选择不做临床医生了。因为现在这种住院医生,都变成了流水线的纺织女工,做的都是重复性的工作,不停地在写病历。几个上级医生,一天做100个各种各样的手术,下面的住院医生,就在那写病历,他们感觉不到自己能学到什么智慧,学到什么经验。

所以要呼吁,要想真正把临床医生的思维方法教给医学生和年轻医生。要改变的话,首先应该要有医生的助理,现在医生没有助理,尤其住院医生和主治医生做着非常低层次的重复性劳动。我们医生经过这么多年的培养,结果却要做一些非常低智商的劳动,浪费了医生的培训时光,使医生不能够很好地用创新临床思维去做创新的临床工作。

主持人肖飞教授:

十二年前,我曾有幸采访过黎磊石院士,那个时候,他就说医生分成几个层次:能工巧匠、临床专家和医学科学家。曾教授,您选的是哪个?

曾小峰教授:

我觉得证据分好多,病人给你提供病历、提供病史,就是给了你证据,你要根据他的证据来去寻找线索,再去检查,也就是寻找线索。所以我们要诊断,是step by step(一步一步来)的。

当然我们需要临床经验,如果一个病人跟我说,他是年轻男性,腰背疼,一听有炎性腰背疼,你可能会判断他是脊柱关节病,你可能会去找这些证据。但是实际上,你可能也是根据证据来进行寻找,而不是这个病人没开口,往那一站,你就给他设定了几个。这样的话,往往可能你就自己掉到坑里去了,我觉得这个对我们来说是不好。

因为我见过有一些医生是很偏执的,他就知道一个病,什么人到他那看病,都是这个病,我看见不少这种大夫。所以我觉得我们不能够事先设定,一定是根据证据来寻找。所以,我觉得我们看病是一个科学的过程。

沈锋教授:

我非常同意陈院士刚刚那个,其实我们国家的统计学,流行病学确实是有一定的局限,特别是在某些落后的地区,不是非常完整。比如像上海、北京这些地区,肯定还是比较准确的,恶性肿瘤也同样也这个道理;但是在边远地区,它的标化死亡率、标化发病率,是有一些误差的。

刚才陈院士讲的我非常同意,其实我们预见到的,比如说通过计划免疫以后,可能乙肝会有所下降。但是我们发现,从整体来看,现在的统计学资料显示,乙肝的总体人数上没有表现出明显的下降,但是患者发病的年龄有所上升;肝癌也同样,与以前相比,肝癌患者的发病年龄上升。从这个角度来推测,疫苗是有效的!

但其实到目前来说,还没有一个绝对的数字来说明这一点,但我们国家的肝癌的确是这个情况。前几天汤钊猷院士90岁的时候,他说了这样一番话,他说原来肝癌是第二位、第三位的死亡原因,后面下降了,下到第四、第五位了,最近又上升到了第两、三位。而且汤老师说这个的时候,我认为他是经过了反复的检索,反复的文献检查,他是一个非常认真的表态。

陈香美院士:

重大传染病这5年执行下来的重大专项,有非常多的成果,其中有一项成果大家都是公认的:乙肝的母婴传播基本上是阻断了。这一点为咱们国家在将来摘掉乙肝大国的帽子,奠定了非常良好的基础。但现在又有调查说病人的总数还是在不断地上升。这些问题,当时我也问过重大专项的顶层设计专家以及很多院士们,他们说在示范区,统计数据就是这样。示范区的统计结果是不是推广到全国各地都行得通呢?还有很多临床科学研究的方法,值得我们每一个科学家、临床医学科学家去考虑。

主持人肖飞教授总结

我们都很期待这样可以预测治疗方案转归概率的天气预报系统。那么,现在的人工智能大数据已经能起到什么作用了呢?现在非常成熟的就是影像识别,2019年在厦门抓了一个逃亡20年的逃犯,就是通过人脸识别,然后再做了基因的识别,最后把他给抓起来了。

从现在的X光、CT(计算机断层扫描)、MRI(核磁共振)等影像学检查的结果,已经能够非常准确地做出肺癌的诊断。人眼可能漏诊,但是人工智能可以抓住细微的线索。脑卒中患者的MRI,放射科医生需要半小时才能给出检查结果。然而如果患者真的是脑卒中,这样长时间的等待无疑会耽误及时治疗的机会。但是现在的人工智能可以在10分钟之内,大约5分钟左右就可以通知医生采取行动。病理的诊断也是通过模式,现在已经从标注变成了像素,可以看到乳腺癌的淋巴细胞转移。

还有眼底图像以及皮肤癌的识别。皮肤科用A、B、C、D、E来表示不同的意义:A是不对称,B是边缘不整齐,C是不同的颜色,D是直径变大了,E是有证据表明它在变化。这个A、B、C、D、E,是皮肤科医生来诊断黑色素瘤的重要标准,用人工智能来替代后,就把斯坦福大学的皮肤科医生给打败了。皮肤科医生需要更长的时间来做出诊断,而人工智能只需要非常短的时间就能给出诊断。

以上就是以图像、语言为基础的人工智能识别。此外,还有一种非固定模式的人工智能,也实现了。比如说在美国有终末期关怀机构,如果说一个人马上就要死了,你想关怀也来不及了,这些人即使愿意死在家里,也没机会回到家里了。为了避免这种措手不及,需要判断哪些人在未来3个月到12个月之间可能要去世,给他各种减除痛苦的药物和措施,让他最终不受痛苦地离开这个世界。他们用了上百万人的电子病历,搜集了一万多个指标,进行机器学习,300多层的机器学习,最后能达到80%以上的准确预测,让病人可以得到临终关怀。

再说说自杀的预测,过去自杀也曾用过一些医生建立的回归模型,结果预测的准确率只有50%多。通过人工智能和机器学习的结果,预测的准确率达到了将近90%,这样就可以及时地干预。这是非模式化的,它不像图像识别是模式化的,而是用临床数据建立了人工智能。

在风湿科,也有这样的机会。比如说某位患者的病情呈持续缓解状态,在【风湿中心】管理平台就可以提示医生,对这位患者的治疗方案进行干预。根据疾病活动程度的β分布,从基线到治疗一段时间后,有个自然转归。我们可以看到,无论是联合治疗,还是单药治疗,在维持缓解这一段,不同方案治疗后的患者转归并没有差别。而在疗效相同的情况下,与联合用药方案相比,单药或者简单方案的安全性更好,患者的经济负担也更轻,医生就可以选择简单的一些方案,下台阶治疗。

反过来,如果患者的病情在变坏,系统识别以后传到云端,再发到医生的手机终端,提醒医生可以根据治疗原则,对患者进行上台阶治疗,从而得到更好的效果(图15)。

另一种情况,如果某位患者的病情持续不改善,一直处于严重疾病活动度状态,医生也可以收到信号:治疗三个月没有效果。这个时候,可以考虑改变治疗方案,比如说生物制剂等二线药物,就可以加上去了。

按照疾病活动的程度,慢性疾病通常可分成“缓解、轻、中、重”四种状态,在治疗时都有转归的规律,每个状态都可以维持在原状态,或者向另外3个状态去转换,也就是4个状态在往16个方向走。在另外的一个时间层面,这4个状态,又在往16个方向走,是以平方的方式、级数的方式往上走的(图16)。我们怎么来判断?需要的就是对实时数据来进行跟踪。

其实很简单,医生可以采取简单的三个步骤,就是——病情好转了,下台阶,减少用量,或者是减少治疗药物的品种;如果复发了,就上台阶;如果持续增高不改善,就改变方案(图17)。这三招,应该就能把80%的病人的病情给控制住了。

全世界现在面临的问题是,没有数据可以告诉医生病人现在所处的状态。实际上,这是很好实现的,这还只是机器的一个自动提醒。比如,4年的追踪数据显示,在有那么多好药治疗的情况下,病人的基线达标率只有28%(图18)。好几个数据库,包括曾小峰教授领导的CRDC数据库,包括栗占国教授等开展的横截面调查,都显示出了类似的达标率,证实临床达标率就是这么低。

然而,这其实是可以改善的,只要利用【风湿中心】每三个月监测一次,像BeSt的研究一样,医生来做调整,在不去干预任何用药的情况下,就可以达到BeSt临床试验的效果,达到60%多的达标率,这是我们中国医生创造的奇迹(图19)。

《Nature》杂志曾刊出过一幅图(图20),列出了销售额位居前十药品的有效率,其中Humira(阿达木单抗)、Remicade(英夫利昔单抗)和Enbrel(依那西普)这三种生物制剂的治疗有效率,在美国的真实世界只有25%,达标率非常低。治疗胃食管反流的药物,疗效只有不到5%。销售额前10位的药品,有效率都不尽如人意,为什么?因为美国的专科医生也不知道病人治得怎么样,都是按照保险公司的安排,病人要排队,等两个月之后才能排到他,而有的病人是不需要来的,也有的病人病情已经变坏了。所以,出现这种结果并不奇怪。我们现在在没有很好的判断方法的情况下,起码能监测药物的效果,然后及时采取措施。

穆荣教授在2019 ACR年会上有一篇壁报,把前验经验和后验经验画了出来(图21)。一个病人,他已经达到了临床缓解状态(用R表示),三个月之后会变成什么样?从图中可以看出,来氟米特治疗相较于来氟米特加MTX治疗,没有区别。此时,我们可以判断,对于缓解人群和低活动度人群,可以单独用药。但是如果是高活动度的患者,似乎联合用药更好。由此可见,我们可以预测病人的转归。这种转归预测,实际上就是走向精准医学的关键。

《新英格兰医学杂志》曾说,像所有的工业革命一样,数据科学革命也是颇具颠覆性的,随着机器学习对临床医学的改变,受益最大的将是病人。

SSDM模型架构是数据科学的模式,最后让病人受益。比如说患者可以把自己的数据输入SSDM,包括实验室检查指标、用药方案,然后自我评估病情。这些数据集中以后,进入云端,同步到医生的终端(图22)。

医生周围的病人越来越多,而其中30%到40%的患者是不需要来门诊看的,医生可以通过在线互动,帮助他们解决一些问题;同时这些数据可以帮医生验证自己的判断是不是准确。医患跨时空的互动给病人节约了12倍的费用,降低了机会成本,满意度100%(图23)。而患者在平台上对医生提出的问题,都可以纳入人工智能,以后变成一个医生辅助的自动回答系统,风湿科医生真正是在改变和重塑医疗模式。

现在的医疗体系下,病人可以随便找医生看病,看病难是个悖论,中国的看病难是看病太容易造成的。任何人去排队,都可以看专家,实际上40%的病人不需要看这些专家,他们可以用其他的方式解决自己的问题。

2017年,在张奉春教授主导下所开展的医疗经济学研究结果在美国风湿病学会(ACR)年会上报道,ACR非常重视,进行了官方报道、新闻发布会、壁报巡讲和大会发言(图24)。SSDM工作组和中国的风湿科医生,提出了一个观点:疾病管理是良药,智能疾病管理优于良药。

良药的定义需要满足几个标准,包括安全、有效、经济、可获得性和满意度。提到安全,在SSDM系统中,一是有安全的警示,描述出不良反应谱,辅助撤药,可以预测,就是预测和辅助;第二个,疗效可以提示,让医生及时采取行动,因为病人的数据是可以实时提醒的,就可以做一些预测,并辅助医生来决策;三是经济,已经为病人节约了大量机会成本;四是使用起来比较方便,可获得,满意度高。这就符合了良药的定义。
我们从自然界,从病人那里,把数据采集来,通过医生的梳理变成了信息;把这些信息可用、固化,变成了知识;合理的使用就变成了智慧。

习近平主席在做2018年新年致辞的时候,办公室的书架上摆了一本书,被《中国日报》给拍了下来,叫《终极算法》,习主席也在看算法,实际上他可能在用这种算法来领导我们的国家,制定方针政策。作为一线医疗工作者,更应该重视算法。

当我们把医学和自动驾驶进行匹配的时候(图25):

驾驶的自动化可以分为0~5级:

0级,没有自动化,驾驶全靠人。

1级,辅助系统能让车保持速度和车道,但还是人在控制。

2级,部分自动化,除了能自动控制速度,还能控制方向盘,例如控制汽车以平稳的速度行驶、保持车道。

3级,有条件自动驾驶,自动驾驶系统代替人类驾驶以及监控路况,驾驶员变成乘客,但遇到问题,还是需要人类来控制车辆,仍依赖于人类驾驶员的支持。

4级,高度自动化,自动系统能做任何事情,不再需要人类的支持,仅在有限的极少数情况下需要人。

5级,完全自动化,真正的电子驾驶员,完全不需要人类,能在任何情况下行驶。

医疗自动化0级~5级:

0级,没有自动化。

1级,可以对已出现的风险进行报警,及时反馈治疗效果,让病人可以平稳地沿着治疗方案,顺利实施。

2级,除了警示外,可以对风险进行预测,对遇到的风险提出合理的规避建议,但仍需医生来执行;有疗效的预测和决策辅助体系,寻求更佳的方案。

3级,病人可以依据系统自动接受最合理的方案治疗,将病情控制到最佳状态,必要时医生介入。

4级,高度自动化,系统承担大部分诊疗工作,只有在系统出现问题时需要医生干预。

5级,智能系统完全取代医生,自行管理疾病。

那么现在绝大多数医疗仍处于0级,没有什么自动化,然而在个别领域,已经开始出现突破。例如在中国风湿科领域,智能疾病管理系统(SSDM)的应用,已经将风湿这一领域带入了2级自动化。SSDM系统能辅助病人,在不改变治疗方案的情况下,帮助医生病人管理疾病、提高达标率,医生仍是病人的主要管理者。这与自动驾驶的1级相类似。在此基础上,SSDM还融入了AI,警示风险、辅助临床预测和决策,医生在这一过程中提供支持(backup)。由此达到2级自动化。未来,患者将在SSDM的赋能下成为driver,而医生的工作量将大大减轻,仅作为支持者。

回到大健康的马尔可夫模型,把人群分成健康、亚健康、疾病和康复四种状态(图26)。没有病痛、精神愉快、有社会价值,这是WHO定义的健康。如果出现一个指标的异常,还没有器官损害,比如高血脂、高血压、高尿糖、高血糖、这是亚健康风险人群,是可以通过生活方式的调整将之拉回健康状态的。但是如果出现器官损害了,不管是肝功能损害,还是肾功能损害,就成了病人,需要医生照顾。病被控制了,但病人不一定有社会功能,还不愉快,需要康复,此时应该让他恢复社会价值、生活愉快、没有病痛,这样就恢复了健康。

所以,扩展开来,健康不是一定要没病才行。如果一位透析患者,没有病痛,有社会价值,生活愉快,也可以实现健康,所以人人都可以实现健康。正如肖飞教授和他的老师吴孟超院士,以及沈锋教授,在2007年所提出的“与疾病共生存”的理念,类似的,2012年美国医学会也提出“与疾病更好地共生存”。

随着年龄的增长,疾病不可避免会出现,而我们希望到了90岁、95岁的时候,生活质量还非常好,不给社会增加负担。但是在2~3个月之内,结束我们自己的生命。怎么实现这一理想呢?需要把数据科学用在健康上,用在病人上,实现医学革命。

(整理报道:贾玉华)

Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5