论文部分内容阅读
目的:构建一种基于传统手工特征的人工智能(AI)方法并探讨其自动识别胎儿颜面部超声标准切面(FFUSP)的价值。材料与方法:本研究以妊娠20~24周FFUSP图像为研究对象,包括标准集图像、验证集图像和实验集图像。标准集图像由我院(三级甲等医院)胎儿超声专家参照相关指南标准采集,并以8:2的比例分为训练集和测试集;验证集图像来自本地区三所三级医院,采集方法与标准集图像相同;实验集图像来自我院超声图文工作站。三个图像集内均包含了鼻唇冠状切面(NCP)、正中矢状切面(MSP)、经双眼球横切面(OAP)三个标准切面以及非标准切面(N-SP)。构建一种基于传统特征识别技术的AI模型,利用训练集训练其识别与分类NCP、MSP、OAP及N-SP的能力并对测试集进行分类测试。AI模型构建成功后,以验证集测试该模型对不同来源的FFUSP图像识别泛化能力。由AI、三名仅经历过住院医师规范化培训的医生组成的初级医生组、三名经历过产科超声专科培训的医生组成的中级医生组分别将实验集图像分类为NCP、MSP、ECP、N-SP,以专家分类为标准,观察AI及两组医生对实验集图像的分类情况,分析AI与不同经验的超声医生对FFUSP识别与分类能力的差异。结果:标准集FFUSP图像共1906张,包括OAP232张,MSP323张,NCP456张,N-SP895张,各切面按照8:2的比例将图像分为训练集和测试集;验证集图像共810张,包括OAP238张,MSP307张,NCP122张,N-SP143张;实验集图像2419张,经专家判断包括OAP397张,MSP533张,NCP594张,N-SP895张。1.AI模型对测试集图像识别与分类与专家分类一致性强(P皆<0.05),对各切面的识别敏感度(SE)、特异度(SP)、阳性预测值(PPV)、阴性预测值(NPV)、F1分数、准确率(ACC)、k值分别为:(1)NCP:93.4%、99.3%、97.7%、98.0%、0.955、97.9%、0.942;(2)MSP:93.8%、98.8%、93.8%、98.8%、0.938、97.9%、0.925;(3)OAP:91.3%、98.5%、89.4%、98.8%、0.903、97.6%、0.890。2.AI模型对验证集图像的识别与专家分类一致性高(皆P<0.05),对各切面识别的SE、SP、PPV、NPV、F1分数、ACC、k值分别为:(1)NCP:86.6%、91.4%、80.8%、94.2%、0.836、90.0%、0.764;(2)MSP:88.3%、81.5%、74.5%、91.9%、0.808、84.7%、0.673;(3)OAP:88.5%、87.9%、56.5%、97.7%、0.690、88.0%、0.620。3.初级医生识别实验集各切面SE、SP、PPV、NPV、ACC分别为:(1)NCP:78.6%、86.5%、54.4%、95.2%、85.2%,(2)MSP:79.7%、85.9%、43.5%、96.9%、85.1%,(3)OAP:87.1%、93.1%、62.7%、98.2%、92.4%;中级医生识别实验集各切面SE、SP、PPV、NPV、ACC分别为:(1)NCP:88.6%、91.1%、70.9%、97.0%、90.6%,(2)MSP:89.6%、91.2%、66.4%、97.8%、90.9%,(3)OAP:92.7%、94.5%、70.5%、98.9%、94.3%。中级医生对FFUSP各切面识别与分类能力皆优于初级医生(皆P<0.05)。AI识别实验集各切面SE、SP、PPV、NPV、ACC分别为:(1)NCP:98.7%、97.1%、90.9%、99.6%、97.5%,(2)MSP:98.1%、96.8%、88.4%、99.5%、97.1%,(3)OAP:94.8%、95.7%、77.6%、99.2%、95.6%。AI对实验集各标准切面的识别与分类水平与专家分类具有极强的一致性(P<0.05)。AI对三个标准切面的分类的敏感度特异度均优于初级医生(皆P<0.05),对NCP、MSP分类敏感度、特异度均优于中级医生(皆P<0.05),对OAP分类敏感度优于中级医生,特异度上两者间无明显统计学差异(P=0.063);对FFUSP各切面分类AUC表现为AI>中级医生>初级医生(皆P<0.05)。AI分类实验集各切面耗时为0.21±0.02秒,专家分类耗时为2.73±0.09秒,AI对FFUSP实验集图像分类效率明显优于医生人工识别效率(皆P<0.001)结论:1.产科超声专科培训有助于提高医生对FFUSP的识别与分类能力。2.本研究所采用的基于传统手工特征的人工智能模型在FFUSP识别与分类上具有高效、高准确性,且对不同机构来源的图像具有较强的识别泛化能力,可作为胎儿超声图像大规模质量评价的替代工具。3.本研究所采用的人工智能模型在对FFUSP识别准确性优于中低级别医生,可作为胎儿超声规范化培训的辅助工具。