原创 2018-02-23 BioTalker 奇点网
今天,由张康教授领导的广州妇女儿童医疗中心和加州大学圣迭戈分校团队,在顶级期刊《细胞》上发表了一篇人工智能(AI)在医疗领域应用的重磅研究成果:基于深度学习开发出一个能诊断眼病和肺炎两大类疾病的AI系统[1],准确性匹敌顶尖医生。
这不仅是中国研究团队首次在顶级生物医学杂志发表有关医学人工智能的研究成果;也是世界范围内首次使用如此庞大的标注好的高质量数据进行迁移学习,并取得高度精确的诊断结果,达到匹敌甚至超越人类医生的准确性;还是全世界首次实现用AI精确推荐治疗手段。
《细胞》以封面文章的形式,刊登了来自中国的这项AI研究。
期刊封面
深度学习是AI的热门研究领域,2006年由多伦多大学教授Geoffrey Hinton[2]提出,我们所熟知的AlphaGo、AlphaGo Zero,以及自动驾驶这些重量级应用,都是基于深度学习技术开发的。
不过,最让我们期待的,可能是AI在医疗领域的应用。
在全世界范围内,专业高质量的的医疗资源是稀缺的。有许多缺乏专科医生的相对贫困的地方,许多人对自己的疾病状况不自知,即使在相对发达的城市区域,由于城市人口多、人口老龄化、慢性病发病率增高等导致病人数量庞大,而对应的专科医生供不应求,也使得大量病人不能及时转诊就医,从而延误就诊治疗的最佳时机。
因此,科学家十分期待AI可以对诊前疾病的筛查、预防,就诊时医疗图像辅助诊断、检验结果分析、手术辅助,以及就诊后的医疗随访、慢性病监测、康复协助、健康管理,甚至对于基础科研辅助、药物研发、基因筛选分析、医疗培训等等带来革命性的变革。
研究论文首页
不过这一切来得似乎没有那么容易。
直到10年后的2016年,深度学习终于在大数据、图形处理器运算能力增强和新算法的支撑下,迎来高速发展。
也就是这一年,Google的Gulshan团队采用近13万张已由54位美国专家标注过的视网膜眼底图像,对深度学习网络进行训练,检测准确率达到曲线下面积91%,能力与人类专家相当[3]。这项研究成果最后发表在顶级医学期刊JAMA上。
没多久,在2017年春节期间,斯坦福大学工程学院和医学院合作团队在《自然》上发布了在皮肤癌诊断领域的最新突破[4]。他们在谷歌用于识别猫和狗算法的基础上,经过13万张皮肤病变的图像训练后,开发出可用于识别皮肤癌的AI系统。在与皮肤科医生的较量中,AI系统的准确率达到69.4%,而人类专家的准确率在66%左右。
在本研究中,张教授团队应用一个多层次的前馈DNN概念,将预训练模型Inception-v3架构植入到开源机器学习平台TensorFlow,输入总共约10万张准确标注的视网膜OCT(Optical Coherence Tomography, 光学相干断层成像术)图像,最后开发出可以准确诊断眼疾的AI系统[1]。
该AI系统在诊断眼疾时的准确性达到96.6%,灵敏性达到97.8%,特异性达到97.4%,ROC曲线下面积达到99.9%。
AI系统与6个专家大比拼数据对比
尽管AI在医学领域的探索已经取得了相当不错的成绩,但是最终应用到临床却很少。北京协和医院放射科主任金征宇教授认为,主要原因之一是人工智能系统在复杂的临床应用中,不能准确收集到高质量可应用的数据(即有效数据),所得出的结论缺乏可靠性,难以保持测试数据集上的高准确率[5]。
2016年Google那篇文章在JAMA上发表的时候,论文的主要作者Gulshan如是说:“访问有高质量注释图的大型数据库,是深度学习模型成功的先决条件。”
正如前面Google和斯坦福大学,以及张康教授团队的研究所呈现的那样,训练出一个准确的AI疾病诊断系统需要数十万张高质量标注的图像。
可世界上有那么多种疾病,给每种疾病都收集数十万张高质量的标注图像几乎是不可能实现的。这个问题不解决,现阶段AI在医疗领域的应用就很难全面展开。
张康教授团队这个重磅研究,就很好的解决了这个问题。
“相比于传统的深度学习模型,我们使用的迁移学习模型所需的数据量极少,一般深度学习需要上百万的高质量的同一类型标注图片才能获得较为稳定和精确的输出结果,而我们的方法只需要几千张。”张康教授告诉奇点网,“并且我们构建的诊断平台在诊断常见的致盲性视网膜疾病上,能够获得与人类眼科专家相似甚至更好的诊断结果。”
张康教授
“迁移学习”(Transfer Learning),顾名思义就是就是把已训练好的模型参数迁移到新的模型来帮助新模型训练,也就是运用已有的知识来学习新的知识,找到已有知识和新知识之间的相似性,用成语来说就是“举一反三”。
比如,已经学会下围棋,就可以类比着来学习象棋;会打篮球,就可以类比着来学习排球;已经会中文,就可以类比着来学习英语、日语等等。如何合理的寻找不同模型之间的共性,进而利用这个桥梁来帮助学习新知识,就是“迁移学习”的核心。迁移学习被认为是一种高效的技术,尤其是面临相对有限的训练数据时。
相较于其他大多数学习模型的“从零开始”,迁移学习先利用卷积神经网络(Convolutional Neural Network,CNN)学习已有的已经标记好的预训练网络系统。
以医学图像学习为例,该系统会识别预系统中图像的特点,研究人员再继续导入含有第一层图像相似参数和结构的网络系统,最终构建出终极层级。
在张教授团队开发的AI系统中,第一层网络就是视网膜OCT图像,第二级网络系统使用第一级的图像寻找相应的特点,通过前向传播固定低层图像中的权重,找到已经学习的可辨别的结构,再利用反向传播的方法提取更高层的权重,在其中进行反复的自我调整和反馈、传递,达到学习区分特定类型的图像的目的。这个模型可以使用极少的训练图像,更快、更高效的辨认图像的特定结构。
(图:https://morvanzhou.github.io/)
为了验证这个AI系统在迁移学习的帮助下能应用于视网膜疾病之外的其他疾病,在本研究中,张教授团队在10万张准确标注的视网膜OCT图像训练出来诊断眼疾的AI系统基础上,只用了5000张胸部X线图像,然后利用迁移学习,就构建出肺炎的AI疾病图像诊断系统。
这套AI系统在区分肺炎和健康状态时,准确性达到92.8%,灵敏性达到93.2%,特异性达到90.1%,ROC曲线下面积达到96.8%;更牛的是,它区分细菌性肺炎和病毒性肺炎的数据也是相当漂亮,准确性达到90.7%,灵敏性达到88.6%,特异性达到90.9%,ROC曲线下面积达到94%。
在世界范围内,使用如此庞大的标注好的高质量数据进行迁移学习并取得高度精确的诊断结果,得到与人类医生相似甚至更高的准确性,这在世界上是第一次。
张教授团队在实现一个AI系统诊断多种疾病上,可没少花心思。
通过预先的训练,他们的AI系统已经可以达到准确判断视网膜疾病的效果,加上一定数量标注好的正常及肺炎X线平片对其进行训练,再通过简单的调整,包括层的重排和层中为适应输出肺炎图像而增加“过滤器(filters)”的数量,机器通过前馈机制自我训练、自我学习,找出两者之间的异同点对照学习,举一反三,直接获得稳定的较高的肺炎诊断准确率。
“一个AI系统诊断多种疾病的关键因素是,对于诊断不同的疾病之间的切换的容易度。”张康教授说,“在其他的研究中,研究者需要根据不同的疾病设计相应的过滤器,而我们的算法会根据输入的学习图像产生自己的过滤器。”
张康教授认为,迁移学习在深度学习上面有极为广阔的应用前景,在图像数据资源有限的医疗领域,更高效、所需图像数量更少的迁移学习,可以说是未来5年内AI发展的热点以及深度学习成功应用的驱动力。
实际上,迁移学习是深度学习的一个自然发展方向,它能让深度学习变得更加可靠,还能帮研究人员理解深度学习的模型。
例如,研究人员能够知晓哪部分特征容易迁移,这些特征所对应的是某个领域比较高层、抽象的一些结构型概念。把它们的细节区分开,就能让研究人员对这个领域的知识表达形成一个更深的理解。这样一来,机器就可以像人脑的神经系统一样终身学习,不断地对过去的知识进行总结、归纳,让一个系统越学越快,而且在学习过程中还能发现如何学习。
迁移学习在机器学习中的地位以及未来的发展趋势
本研究另一个亮点在于,之前的AI系统对于疾病的诊断具有参考意义,但不能指导治疗,而视网膜OCT在糖尿病视网膜病变和黄斑变形的诊断上可以量化并能够指导治疗,因此具有不可替代的价值。
例如,张教授团队开发的AI系统可以准确判断患者是哪种眼疾,哪些需要“紧急转诊”,哪些“常规转诊”即可。这可以帮助医生快速判断哪些患者属于重症患者,需要及时治疗,以避免疾病对患者造成不可逆的伤害。
张康教授团队的这项研究意义远不止如此。他们还考虑到了一个最让医生关注的问题。
在使用AI诊断疾病的时候,医生最不放心的就是:AI到底是如何判断的?到底靠不靠谱啊?
对于这个问题,张教授团队也巧妙地解决了。他们在视网膜OCT图像的研究中加入了“遮挡测试”,也就是机器会输出色块遮挡其“认为”的病变部位,这样医生就可以直观评价机器诊断的正确性,也为其形成诊断提供依据。
AI系统用色块遮挡住病变区域
这下医生就可以放心了,如果对于AI的诊断不放心,可以通过遮挡测试直接查看AI是如何作出疾病“判断”的。
张康教授说,目前他们的AI系统已经在美国和拉丁美洲眼科诊所进行小规模临床试用,取得经验后在进行大规模推广。此外,在后续的研究中,他们还会进一步增加准确标注的图片数量,同时增加可诊断的疾病种类,并进一步优化系统等。
他们希望在不久的将来,这项技术将能应用到包括初级保健、社区医疗、家庭医生、专科医院等等,形成大范围的自动化分诊系统,为医生提供一种辅助诊断的方法,并可用于监测和维护人类健康,从而提高人类生活质量。
编辑神叨叨
张教授之前接受过我们的独家专访,想了解张教授的朋友,可以点击此处去看看。
参考资料:
1. Kermany et al. Identifying Medical Diagnoses and Treatable Diseases by Image-Based Deep Learning[J]. Cell, 2018, 172: 1-10.
2. Hinton G E, Salakhutdinov R. Reducing the dimensionality of data with neural networks.[J]. Science, 2006, 313(5786): 504-507.
3. Gulshan V, Peng L, Coram M, et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs[J]. Jama, 2016, 316(22): 2402-2410.
4. Esteva A, Kuprel B, Novoa R A, et al. Dermatologist-level classification of skin cancer with deep neural networks[J]. Nature, 2017, 542(7639): 115.
5. 金征宇. 前景与挑战: 当医学影像遇见人工智能[J]. Med J PUMCH, 2018, 9(1):2-4