李静雯 王令珑 赵阳光 崔伟男
(1.中国信息通信研究院云计算与大数据研究所,北京 100191;2.香港理工大学,中国香港 100872)
0 引言
由于人口老龄化现象加剧,加上现代社会人们用眼过度问题突出,有数据显示,我国每年有近4 亿患者饱受各类眼科疾病的困扰,白内障患病人数高达2.5亿甚至2.8 亿,青光眼患者预计达到2 100 万人,尤其老年人居多[1]。如此庞大的患病人群,如若不能得到及时治疗,严重会导致残疾,严重影响患者的生活质量,同时给社会带来沉重的医疗负担。
与庞大的患者数量形成鲜明对比的是,基层眼科医师数量较少,无法满足全国各地患者需求。现阶段,我国正从顶层设计层面改善医疗资源分配不均的问题。2022 年1 月,国家卫生健康委员会发布了《“十四五”全国眼健康规划(2021—2025 年)》,明确提出我国逐步建立并完善“国家—区域—省—市—县”五级眼科医疗服务体系,强化二级以上综合医院眼科设置与建设,补齐眼科及其支撑学科短板。若能利用人工智能技术辅助眼科医师进行疾病诊断,有助于基层医疗机构提高眼科疾病的筛查能力,有效缓解眼科医疗资源匮乏的现状,实现医疗资源在基层医疗机构的全面覆盖以及眼科疾病的早期干预,使患者及时得到有效治疗。
1 机器学习及其医疗应用概述
1.1 机器学习简介
人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学,其目标是像人一样决策和行动。人工智能这一概念被提出后,历经数年的发展,已取得了卓越的研究成果。特别是深度学习被提出后,人工智能再次取得突破性进展,同时移动互联网的发展也为人工智能带来更多应用场景。如今人工智能已在多个领域崭露头角,能够辅助或代替人类完成一些复杂的高精度工作。
机器学习是实现人工智能的重要途径,也是最早发展起来的人工智能算法。与传统的基于规则的算法不同,机器学习能够通过计算模型和算法从大量数据中学习到规律和特征,自动学习如何获得算法模型参数。根据数据形式(即数据是否有人工标注)不同,机器学习算法可以分为监督学习、无监督学习与强化学习三种。
监督学习采用人工标注的数据进行训练,是相对成熟的机器学习算法,常见算法有决策树、支持向量机(Support Vector Machine,SVM)、神经网络等;无监督学习能够从未标注数据集中挖掘数据的分布或数据间的关系,常见的算法有 K 均值聚类(K-Means Clustering,K-Means)算法、主成分分析等;强化学习随着深度学习和神经网络的发展而产生,介于监督学习和无监督学习两者之间,是智能系统在与环境的连续互动中学习最优行为策略的机器学习算法。
此外,深度学习是机器学习的技术分支之一,并且是一种深层的机器学习模型。深度学习通过搭建深层的人工神经网络来进行模型训练,实现知识学习,常用于各种监督模式识别问题,如图像识别、自然语言识别等[2]。最常用的深度学习模型为多层神经网络,其“深度”体现在对特征的多次变换上。
1.2 机器学习在医疗领域的应用
机器学习在医疗领域的研究与应用越来越广泛,机器学习模型通常基于某一特定任务而创建,如疾病预测、智能辅助诊断、疾病预后评估、新药研发、健康管理等方面。机器学习能够对海量医疗数据进行分析进而得到医疗决策。例如,在疾病预测方面,通过分析大量患者的常规临床数据并将其应用到机器学习算法上,可以预测诸如阿尔茨海默病、心血管病等疾病的患病风险;在智能辅助诊断方面,利用大量医学影像数据训练机器学习模型,实现病灶识别与标注、靶区自动勾画、影像三维重建、生理信息定量计算等功能;在健康管理方面,智能可穿戴设备和移动健康应用有助于实现疾病早期诊断、个体化治疗、疾病进展监测与预测;在药物研发方面,机器学习能够辅助预测分子特征、生物活性、不良反应等,有效节约试验成本,缩短药物研发周期。
1.3 机器学习在眼科领域的应用优势
眼科疾病的诊断主要依靠眼底图像。人工智能基于眼底图像的诊断介入,对于糖尿病性视网膜病变、青光眼、黄斑变性等眼科疾病的诊断具有很高的敏感度和特异度,可以为医生的图像诊断结果提供参考依据,有效提升疾病诊断(特别是早期诊断)的准确性,对患者的预后有着重要意义。尤其是对于基层医疗机构而言,人工智能可以有效缓解因医疗资源分配不均带来的就医难题。
例如,糖尿病视网膜病变(Diabetic Retinopathy,DR)是发病率极高的糖尿病并发症。患者的糖尿病病程越长,视网膜病变的病情越重;年龄越大,视网膜病变的患病几率越高。但是,由于糖尿病视网膜病变的初期症状并不明显,加之医疗条件受限以及患者对疾病的认知不足,很多患者常常忽略定期眼底检查,当出现视力下降症状后才就诊,进而导致患者的治疗难度加大、花费增多、预后变差。而基于深度学习的糖尿病视网膜病变筛查方法则为这一疾病的早期发现提供了有效手段。2016 年,谷歌公司在《美国医学协会杂志》发表了关于深度学习在DR 筛查中应用的论文。其中提出的深度学习算法,能够通过视网膜照片判断糖尿病视网膜病变的可能性,有助于医生在资源有限的情况下筛选出更多的病人。本文将重点分析基于机器学习的眼科疾病辅助诊断应用情况。
2 基于机器学习的眼科疾病辅助诊断应用分析
数据和算法是机器学习的两大重要组成部分,本章节将从数据和算法两方面分析机器学习在眼科疾病辅助诊断中的应用情况。
2.1 眼科疾病数据库的特点
现代眼科疾病的检查结果多以图像或数字形式呈现,能够准确客观地记录病情,为临床诊断提供依据,是人工智能辅助诊断系统研发的重要数据资源。目前,常用的眼科诊断方式有射线诊断(X 射线、电子计算机断层扫描、磁共振成像等)、声像诊断(B 超、彩色多普勒成像等)、眼底血管造影(荧光素眼底血管造影等)以及光像诊断(裂隙灯显微镜照相系统、角膜共焦显微镜等)。此外,以手机等远程设备终端获取高质量眼部图片,丰富了眼科图像资源的获取来源,使远程医疗成为可能。
眼科疾病数据库需要具备如下特点:数据量大且种类丰富;数据结构化、规范化。用于机器学习训练的数据质量越高,模型的准确性和泛化性越强,得到的智能辅助诊断系统越具备临床使用价值。但现有的眼科数据,往往存在标注数据量不足、数据种类和形式单一、数据质量较低、缺乏统一标注标准等问题。
目前公开的眼科数据库通常是为了项目或竞赛而创建的,数据量较少、病种较单一,难以满足临床应用的需求。例如ANR-TECSAN-TELEOPHT 项目建立的E-Ophtha[3],由E-Ophtha-MA(包含381 张标注MA 的彩色眼底图像)和E-Ophtha-EX(包含82 张标注EX 的彩色眼底图像)两个子集构成。美国电气与电子工程师协会国际生物医学影像研讨会(ISBI-2018)举办“糖尿病视网膜病变:分割和分级挑战”竞赛时采用的数据集IDRID(Indian Diabetic Retinopathy Image Dataset),由597 张像素值为4 288×2 848 的彩色眼底图像(JPEG 格式)组成[4]。
因此,建立一个高质量的基于人工智能研究的眼科数据库至关重要。数据库的建立需注重数据采集和数据标注两个环节,数据库可包含多种数据形式(图像、文本等)和多病种(白内障、青光眼等),区域性广,并且标注人员经过培训,标注规范,可采用多专家标注并引入专家信任度等指标。同时,在数据库的建设中,数据溯源、数据脱敏、数据审核等流程也应进一步规范,确保该数据库的规范性和科学性。2020 年,在世界人工智能大会上,北京协和医院眼科主任陈有信教授课题组发布了“糖尿病视网膜病变常规眼底彩色照相AI 标准数据库”的建设成果,该数据库包含来自全国14 个地区连续采集的真实世界数据,涵盖目前市场上主要眼底照相机型。经伦理审查和清洗脱敏,筛选出1.5 万张糖尿病患者后极部眼底彩照,由北京协和医院眼科阅片团队进行标注,通过内部专家评审和国内同行权威专家外部评审,建立包含15 000 张高质量标注彩照的检测数据库[5]。数据库按《深度学习辅助决策医疗器械软件审评要点》构建,充分体现了“权威性、多样性、科学性、封闭性、动态性、规范性”等特点。
2.2 眼科疾病辅助诊断系统的算法及应用
目前用于眼科疾病辅助诊断系统的机器学习算法主要为监督学习,通过带有专家标注的眼科疾病数据进行模型训练,获得区分度大的特征用于疾病分类。被引入眼科疾病检测的传统机器学习算法中,常见算法有决策树、支持向量机、K-Means 等。Odstrcilik[6]等采用马尔可夫随机场提取眼底图像特征,支持向量回归模型预测视网膜神经纤维层厚度,实现青光眼的评估。Acharyar[7]等考虑到白内障的病情严重程度与眼前段图像模糊度成正比的现象,采用模糊K 均值算法和反向传播算法对预处理后的140 张眼前段图像进行特征提取并分类,其准确率、敏感度和特异度分别达到93.33%、98.00%和100.00%。Lin[8]等用随机森林生成模型预测儿童近视进展,实现早期干预。
近年来,深度学习算法也被广泛应用,卷积神经网络(Convolutional Neural Networks,CNN)评估糖尿病患者的大型多种族群体的视网膜图像时,具有高达93.8%的灵敏度和94.5%的特异度[9]。中山大学中山眼科中心建立的“CC-Cruiser 先天性白内障人工智能平台”(简称“CC-Cruiser”)通过裂隙灯图像检测先天性白内障。该平台自动裁剪相关区域并采用3 个独立的CNN 网络检测是否存在白内障,并进行分级和给出治疗建议,CC-Cruiser 经验证已达到资深眼科专家的水平[10]。
现有眼科疾病辅助诊断系统多为单一病种的分类诊断,包括青光眼、白内障、糖尿病视网膜病变、黄斑病变以及早产儿视网膜病变、弱视、先天性眼病(如先天性白内障等)等小儿常见疾病。但眼科疾病种类繁多,临床表现多样,因此多病种的眼科辅助诊断系统是未来研发趋势,其应用必将有效辅助临床医生提高诊断能力。2021 年底,北京协和医院发布了眼科多病种辅助诊断AI 的临床试验结果。该系统能够对13 种主要眼底疾病和数十种眼部病变进行识别提示和辅助诊断。临床试验结果显示,视网膜色素变性的诊断灵敏度为100.00%,特异度为98.50%;视网膜脱离的诊断灵敏度为100.00%,特异度为98.72%;病理性近视的诊断灵敏度为100.00%,特异度为97.82%[11]。
此外,眼科疾病辅助诊断系统多以单一类型影像(如眼底彩照、裂隙灯照片等)作为模型的输入。但在实际的临床诊断中,医生往往会同时参考不同类型、不同模态的影像样本和其他疾病表征,进行综合诊断。李锡荣[12]将多模态深度学习方式分为数据层融合、特征层融合和任务层融合。数据层将不同模态的样本融合在一起,输入神经网络等学习模型,这种范式要求不同模态的样本之间具备较高的空间关联性。特征层则是在各个模态的特征提取过程中实现融合,常见的融合算法有特征向量拼接、双线性池化、张量融合等[13]。任务层直接将各个模态的预测结果进行融合。Wang[14]等分别从眼底照片和光学相干层析图像中提取相关特征,之后在特征层将不同模态特征拼接起来,实现正常眼底/干性老年性黄斑变性(Age-related Macular Degeneration,AMD)/湿 性AMD 的三 分类。Xu[15]等也采用类似架构,解决了四分类问题(正常眼底/干性AMD/湿性AMD/息肉状脉络膜血管病变)。
3 眼科疾病辅助诊疗类医疗器械监管情况和建议
眼科疾病辅助诊断系统作为医疗器械,需要接受严格的监管,同时作为新兴的人工智能医疗器械,其审批涉及产品划分、算法评估、临床评价、数据处理等多方面内容,审批难度较大。监管机构和医院对数据的安全性和准确性问题还是较为谨慎。而且人工智能算法迭代速度快、算法多样、算法可释性差,特别是深度学习作为“黑盒算法”,仅反映输出与输入的相关性,很难关联现有的医学知识,算法更新难以保证人工智能医疗器械的安全性和有效性,快速迭代的特性也给监管带来很大困难。此外,其伦理规范、评价标准等建设工作尚处于起步阶段。
因此,眼科疾病辅助诊疗类医疗器械监管还需相关监管机构依据产品的特点和功能采取分级分类监管模式和宽严有别的监督方式,将算法设计、开发、应用置于监管机构、伦理委员会和社会公众的共同监督之下,创建完善的人工智能医疗器械产品主体责任体系。同时加强伦理制度建设,提升公众的伦理意识。此外,考虑到当前眼科疾病数据缺乏现状和数据安全问题,可搭建眼科疾病数据集和检测公共服务平台,研究制定包含质控标准、测试规范、评价指标等内容的测评数据,实现对产品安全性、有效性的可靠评估。
4 结束语
基于机器学习的眼科疾病辅助诊断系统能够辅助医生进行眼科疾病诊断,通过技术手段有效缓解医疗资源分配不均、眼科医师缺乏的现状。作为与人工智能紧密结合的新技术,眼科疾病辅助诊断系统具备广阔的应用前景。同时由于该诊断系统是一种新型医疗器械,应在技术推进的同时,加强相关标准、数据库的创建,完善相关监管政策,共同推动辅助诊断系统技术和产业的发展。