失衡数据情况下成团细胞图像合成与分类

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:pipiyouxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来全球范围内宫颈癌的发病率呈逐年上升趋势,已经成为威胁妇女生命的社会问题。DNA倍体分析技术是近年来应用到细胞病理学自动阅片技术。有效的将病理学专家的诊断经验与计算机的精确计算和快速处理能力结合起来,实现对宫颈细胞图像的识别和诊断。该技术首先采集人体细胞标本,并对细胞DNA染色,然后将细胞置于显微镜下,通过高分辨率相机拍摄得到细胞核图片。采用模型训练方法,将细胞核图像进行分类并识别各类细胞核,然后采用图像处理技术测量细胞DNA的相对含量。最后将异常的细胞罗列出来,辅助医生诊断。然而异常细胞大多数存在于重叠细胞团,所以对于DNA倍体系统,准确识别出重叠细胞核至关重要。由于采集到的标本中重叠细胞核种类繁多,收集大量重叠细胞核费时费力,这使得成团细胞核的训练图片数量远远少于其他类别的图片数量,导致训练数据失衡问题。然而大多数分类器学习算法对于不平衡数据分类效果并不理想,解决训练数据失衡问题对DNA倍体系统有重大意义。为解决上述问题,本文提出了失衡数据情况下成团细胞图像合成与分类方法。本文工作包括以下几个方面:1.提出了一种基于余弦不变性的源细胞图像选择方法。该方法首先提取细胞图像的特征值,然后基于特征空间利用余弦不变性原理,挑选有代表性的单细胞图像用来合成大量成团细胞图像。当样本间形成的角度小于定义的阀值时,只有一个输入样本被接受用于作为合成细胞图像的原始材料,增加了合成数据样本的多样性。2.提出了基于随机性的成团细胞图像合成方法。首先源细胞图经过旋转,分割后等处理,用两张图片图合成新的成团细胞核图片。为了使合成的细胞尽可能地接近真实,主要考虑了三个方面的问题。为了确保合成的细胞具有代表性,我们对单细胞进行筛选,获得典型的单细胞图像用于合成。为了避免合成的数据在样本空间过度聚集,在细胞的旋转角度和重叠程度两个方面引入和随机性。为使重叠部分真实,对重叠部分像素需要进行重构。3.提出了一种基于主动学习的合成重叠细胞图像选择方法。该方法首先将大量样本分为多个样本簇,增加主动选择样本的效率;其次根据两条选择标准来选择训练样本,即代表性和不确定性;然后在循环迭代过程中对每一个样本簇进行神经网络模型训练,来选择代表性训练样本;最终将选择出的所有成团细胞图像和单细胞图像,用于模型训练。实验表明,向小类样本类别加入合成重叠成团细胞后,在多种分类器上都取得了识别率的提升。本文方法能用于不平衡数据处理问题上,当小类样本数据量过少无法让分类器学习充分时,有效合理的合成所需的细胞图像,模拟重叠细胞团的纹理、灰度、形状、大小等特征,使分类器更加充分全面的学习小类样本特征。最终结合主动学习方法来选择质量高的成团细胞图像,让模型学习的更好并大大的提高了分类器对细胞图像的识别率。
其他文献
目的:探讨微创经皮肾镜碎石取石术(MPCNL)治疗青春期前儿童肾结石术后引起发热性尿路感染(FUTI)的相关因素及其预防治疗策略。研究方法:回顾性分析2015年1月2018年8月在我院小儿泌尿外科进行MPCNL治疗的360例上尿路结石患儿的临床资料,包括年龄及年龄结构、性别、有无既往同侧肾脏手术史、有无肾脏解剖异常、术前尿培养结果、术前尿常规白细胞计数、肾盂肾盏扩张(肾积水)、术前肾盂积脓(脓肾)
目的:通过对支气管扩张症急性加重期住院患者进行中医证候调查,总结患者中医证候分布特点,为中医辨证施治提供理论依据;对支气管扩张症急性加重期采用基础治疗及中医辨论治的患者进行疗效分析及评价,希望为支扩的中医诊断以及个性化有针对性的中西医结合疗法提供思路,使更多病患能从中得到益处。方法:1.在呼吸科具有5年以上临床工作经验的医师指导下设计支气管扩张症患者情况调查表,收集天津中医药大学第二附属医院呼吸科
研究目的乳腺癌在世界范围居女性肿瘤发病首位,约70%的乳腺癌为激素受体阳性,芳香化酶抑制剂为绝经后乳腺癌患者的一线标准治疗,其治疗时间需长达5-10年,在提高患者生存、降低复发转移的同时,也给患者带来了明显的毒副反应。其中血脂异常为主要的毒副反应之一,使心血管疾病的风险增加,心血管疾病相关死亡已跃居除乳腺癌死亡事件外的首位,严重威胁患者的生命健康,降低患者的依从性及生活质量,因此如何在降低心血管病
儿童不仅有丰富的个人想象力和集体创造力,而且有很强的实践活动和动手操作能力。但是音乐很抽象,孩子还没有形成良好的世界观、人生观、价值观,所以孩子学习音乐相对比较困
目的探讨经肾活检证实的2型糖尿病患者(T2DM)中非糖尿病肾病患者(NDRD)的临床、病理特征。方法收集2016年1月至2018年12月兰州大学第二医院肾内科行肾活检的2型糖尿病患者,结合排除标准,共选择42例患者进行统计分析。收集患者的相关临床、实验室和组织学病理资料。首先依据肾脏病理结果分为三组,I组糖尿病肾病组(DN组,n=21例);II组非糖尿病肾病组(NDRD组,n=10例);III组伴
在交替传译中,口译笔记发挥着重要的作用。高效的口译笔记可以帮助译员减轻记忆负担、理顺话语逻辑、输出流畅的译语。但低效的口译笔记会影响译语的流畅度、完整性和逻辑结构。因此,如何提高交传笔记的有效性是一个值得关注和探讨的问题。本文以小泉进次郎的演讲模拟会议为例,分析了在日汉交传中高效的笔记和低效的笔记都有什么样的表现,对口译会产生怎样的影响,并提出了相应的对策。笔者首先对相关文献进行了归纳和总结,确立
研究目的建立肝阳上亢型高血压认知功能障碍的大鼠模型,研究天麻钩藤颗粒对模型大鼠血清脑源性神经营养因子(BDNF)、甲基乙二醛(MG)和海马神经元的影响,以探究天麻钩藤颗粒防治肝阳上亢型高血压认知功能改变的可能作用机制。研究方法选用32只8周龄雄性自发性高血压大鼠(SHRs)随机分为对照组、模型组、中药组和西药组,每组各8只;另外选用6只8周龄的SD作为空白组。对模型组、中药组和西药组大鼠进行造模,
隧道施工由于隐蔽性和未知因素多的施工及结构特性,而使得作业环境风险性大,施工条件极为恶劣。然而在我国加快基础设施建设的大背景与快节奏下,隧道的修建与施工难以避免的越来越多。受隧道施工过程中独特的因素影响,为保障施工安全,隧道的超前地质预报在隧道施工中就显得不可或缺。在隧道或采矿等地下洞室施工过程中,隐伏岩溶及其所造成的突泥涌水问题也日益突出。从2010年底通车的宜万铁路的马鹿箐隧道、野三关隧道到2
可穿戴电子产品不断扩大的趋势已经达到了柔性透明的时代,这提供了更好的便利性和观赏性,可能会产生新兴技术,如不易察觉的电子产品、智能窗、电子皮肤和符合形状的电子设备。柔性的透明能量存储器件是实现这种小型设备的重要支撑。超级电容器因其较短的充放电时间、高功率密度和长循环寿命,受到人们的青睐。本论文采用低成本水热合成法构筑了形貌各异的纳米材料,测试其电容器的各项性能。本论文主要创新点如下:(1)利用简单
目的本研究拟探讨七氟烷吸入麻醉与丙泊酚全凭静脉麻醉(Total Intravenous Anesthesia,TIVA)两种不同的麻醉方法对体外循环(Cardiopulmonary Bypass,CPB)下行心脏手术患者术后认知功能障碍(Postoperative cognitive dysfunction,POCD)发生的影响。方法选择择期CPB下行心脏手术的患者50例,年龄≥40岁,ASA分级