论文部分内容阅读
眼睛是人体中重要的屈光结构,与人体的视觉神经和中枢神经系统关系紧密。外界信息中有八到九成通过眼睛输入大脑,而种类繁多的眼科疾病无疑是对这一精密屈光组织的最大威胁,有研究表明眼科疾病对于人类视觉发育影响深重。据世界卫生组织资料,包括屈光不正在内的眼科疾病已经成为继肿瘤和心脑血管疾病之后第三大威胁人类健康以及生存质量的疾病。而在我国,盲人数量占到了世界盲人总数的18%,多达500万人。其次,我国医疗资源分布不均匀,高水平医院医生需要花费更多的时间处理常见病,基于机器学习的眼科疾病自动诊断能够缓解此种状况,改善我国医疗环境。本文选取眼科临床诊疗路径中几个关键问题——儿童视力自动评价、多种眼病自动诊断和小儿白内障术后并发症预测展开讨论。由于以上三个问题的诊断与评价标准均定义精准,并且很多重复的诊断浪费了大量医疗资源,机器学习能够很好的适用并且能够减轻重复工作。笔者详细研究其在机器学习应用中的难点——样本量较小、数据分布不平衡、可解释性不强、数据中的突发情况较多、临床应用性差。并且提出了解决以上问题的方法。(1)针对儿童视力检查中的数据分布不平衡、可解释性差和突发情况多的特点,首先第一种结合医生经验构建人在回路的深度学习系统。本系统首先使用目标检测检测每一帧中的重点目标。在整体方法架构中,首先利用目标检测的结果寻找单眼和双眼检测分割点、患者是否配合、患者是否长期对眼、患者是否是N/A视力等级、患者是否视力大于等于0.21,最后利用卷积神经网络分类模型检测患者视力视为[0.01-0.05]或者[0.08-0.15]。在整个的判断过程中,对于每一类别根据医生经验设置了一些阈值用于对一些视力水平的判断,并且使用了88个短视频对这些阈值进行优化。在最终的联合测试中,本系统的准确率为75.54%。在医生与计算机系统的评价结果的讨论中,医生和计算机的评价各有优点,并且使用讨论的方式不断使医生的经验确切化,最终形成人在回路的深度学习系统。其次,针对第一种儿童视力评价方法中阈值过多的情况,提出了针对不同的眼位、视敏卡方位和视敏卡等级组成七通道的视频表示方式和基于一维卷积神经网络的评价方法。采用目标检测的结果,并且采用ROI池化层的思想将视频最后全连接层之前的特征向量(全连接层的输入)长度归一化,最终分类准确率相比第一种有所提高,并且在与三位小儿眼科的临床医生的评比中,两种方法均表现出色。(2)针对深度学习预测结果不可解释和样本分布不均匀的问题,提出了多眼科疾病的可解释与可扩展的统一深度学习诊断框架Visible Genome。本框架的第一阶段为初步判断患者疾病种类,涵盖了白内障、胬肉、角膜炎、结膜下出血和正常五种类别,分类准确率超过93%。第二阶段根据医学影像类型分别判断自然光裂隙灯和钴蓝光裂隙灯中的不同解剖部位和重点病灶,两种类型医学影像的定位准确率分别超过了82%和92%。第三阶段关注重点部位和重点病灶的属性判断,在10种不平衡分类问题中采用带有权重的卷积神经网络,分类准确率为79-98%。而采用完整图像数据集结合卷积神经网络的分类结果类似,说明卷积神经网络在较大目标的分类中能够根据不断迭代发现分类原因。第四阶段根据患者病情询问和之前三个阶段的综合信息情况给出治疗建议,并且采用卷积神经网络判断胬肉患者的手术必要性。基于以上研究开发了多种眼病的可解释人工智能在线诊断系统,并且应用于中山大学中山眼科中心人工智能与大数据专科的临床实践中为患者服务。(3)针对小儿白内障病例数较少,样本分布不均匀的问题,提出基于机器学习的小儿白内障术后并发症预测的整体框架。首先采用apriori算法将最小置信度和最小支持度置为0,挖掘出患并发症和未患并发症的差异性关联规则给医生以指引性参考。关联规则在实际临床中的判别性可以根据判别性阈值自由选择。其次采用三倍交叉验证方式验证随机森林和朴素贝叶斯在预测术后并发症问题中的性能,SMOTE(合成少数类样本过采样方法)将阳性样本的数量扩大,之后分别验证患者是否患并发症、是否患后发障、是否患高眼压的可能性。两种方法的预测准确率均超过了74%,而采用不做平衡处理的数据集的预测结果的假阴性率过高。最后使用遗传特征选择方法挖掘出与并发症最相关的属性。结果表明是否患有并发症和性别和手术年龄无关,是否患有高眼压与二次人工晶状体植入,手术方式,手术年龄和白内障的病灶面积无关,是否患有后发障与性别,手术方式和眼别无关。在最终的外部测试中,三个预测问题的预确率均超过了66%。基于以上成果,开发和部署了web在线测试平台展示关联规则和预测并发症。尽管本文取得了很多进展,但是依然存在着很多不足。首先小儿白内障术后并发症的预测和可解释的多眼科疾病自动诊断需要借助更多的临床数据验证,而且更多的相关属性可以加入以提高准确性。最后,儿童视力自动检测需要借由可穿戴设备并且需要实时判断阶段检查结果以构成一个无需人为干预的全自动系统。