LncRNA及突变基因与疾病关联性分析的机器学习算法研究

来源 :海南师范大学 | 被引量 : 0次 | 上传用户:sidney1221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
探究长链非编RNA(lncRNA)与疾病和突变基因与疾病之间的关联有利于发现疾病的发病原理,并及时做出诊断治疗及预后等措施。但是,传统的病理学家的诊断主观性较强且耗资巨大。因此开发高效的计算机辅助诊断治疗模型是一件迫在眉睫的事情。本文主要先通过基于矩阵分解的交替最小二乘法来探究潜在的lncRNA-疾病关联,为了进一步探索诱发人类疾病的缘由,我们对发病率较高的肺癌进行案例研究,通过深度学习技术识别肺癌组织病理学染色图像中的突变基因来预测其靶向药物。针对lncRNA-疾病的关联性分析的问题,本文提出了一种基于矩阵分解的交替最小二乘法来探究lncRNA-疾病的关联,称为ALSBMF。ALSBMF算法的第一步是将已知的lncRNA-疾病关联矩阵分解为两个特征矩阵,接着运用语义疾病相似度、lncRNA功能相似度以及已知的lncRNA-疾病相关性来定义优化函数,与此同时使用交替最小二乘法求解出两个最佳特征矩阵。最后将两个最优特征矩阵相乘来重新构建得分矩阵,并填充初始矩阵的缺失值来预测lncRNA-疾病关联。和现存的预测lncRNA-疾病关联的模型比较,ALSBMF模型的突出特点是它能在没有负样本的情况下预测出新型lncRNA与新型疾病之间的关联。除此之外,本文还使用了五倍交叉验证与留一交叉验证(LOOCV)来测试ALSBMF的性能。其AUC分别为0.9501与0.9215。针对肺癌与突变基因的关联性分析的问题,本文构建了一个称为Deep LRHE的卷积神经网络(CNN)框架,通过分析患者的组织病理学图像来预测肺癌的突变基因,从而为肺癌的靶向药物治疗提供依据。Deep LRHE的步骤包括肿瘤区域识别、颜色归一化、生物标记识别和热图形成。事实上,本文首先从癌症基因图谱(TCGA)上下载了180个肺癌苏木精-伊红(H&E)染色的组织病理学全幻灯片图像(WSI)。由经验丰富的病理学家标记注释出H&E染片的肿瘤区域,接着通过Openslide软件包的滑动窗口将标注好的肿瘤区域统一分割成512*512的小块,再运用深度卷积高斯混合模型(DCGMM)对分割好的小块进行颜色标准化。然后将处理好的样本训练和验证新型的卷积神经网络(CNN)模型,进而识别出H&E染片中的突变基因。其中测试数据集的受试者工作特征(ROC)曲线下面积(AUC)为0.86。它提供了一种基于肺癌突变基因开发有效靶向治疗的方法,但在临床应用之前,还须继续研究以评估设计模型的有效性。最后,本文总结了我们提出的模型和算法,并且展望了后续的研究。
其他文献
学位
学位
学位
本文以铝合金车架为研究对象,开展基于断面优化的车架轻量化设计,并对结构优化前后的车架疲劳耐久性能进行验证。基于近似模型理论,建立基于关键梁断面参数的各性能响应面模型,在满足车架弯扭刚度及一阶弯扭模态性能前提下,使车架质量最小化。然后基于车架标准正弦载荷谱与疲劳分析相关理论进行分析,进而验证车架疲劳耐久性能。首先基于车架三维模型建立有限元模型,然后对车架分别进行静态特性分析(弯曲及扭转工况)与动态特
官厅水库特大桥是京张高速铁路上的重点控制性工程之一,是国内首例适用于350公里时速有砟轨道高速铁路的钢桁梁桥。位于张家口市怀来县境内,全桥长9.08千米,其中主桥长880米,采用8孔110米简支拱形钢桁梁跨越官厅水库,9个墩位共计
期刊
公共服务是民生领域的重要内容。随着社会经济的发展,人们的生活水平逐步提高,对公共服务也出现精细化、多样化的需求。这要求政府改革创新现有的公共服务提供模式,努力让公共服务水平符合群众的实际需要。中外国家的历史实践证明,政府购买公共服务不仅能满足人们对公共服务产生的更高层次的需求,而且有助于提高公共服务生产的质量和效率。党的十九大提出了以人民为中心的思想和建立共建共治共享的社会治理新格局的重要指示。这
《普通高中物理课程标准(2017年版)》正式发布以后,培养学生的科学思维,成为当代教育教学中的重要课题。高中物理相比于初中物理,知识更抽象复杂,并且要求学生具有一定的科学思维能力。部分学生物理成绩偏低,一定程度上是因为部分学生在高一阶段刚接触物理学科时对物理概念、规律和数学表达的理解产生困难,而物理习题进一步增加了学习物理的困难,学生往往在学习物理知识之后只能理解知识的表面含义,影响知识的运用。本
肺癌是目前世界上最常见的恶性肿瘤之一,肺癌免疫治疗法作为一种几乎无副作用、预后效果良好的新兴治疗方式已成为多个领域的研究热点。2018年免疫疗法正式进入中国并引起各界的广泛关注,目前,关于肺癌免疫治疗国际上获批的相关药物都是通过PD-1/PD-L1的免疫抑制检查点(ICI)来增强抗癌细胞免疫反应,但其在临床治疗过程中的具体疗效仍存在很多不确定性。此后,肿瘤突变负担(TMB)被公认为是免疫治疗的预测
肿瘤可以发生在身体的任何组织,并且在发生后可以转移到全身的其他任何部位。一般说来,原发部位的肿瘤及其转移部位的发生可以被顺利地发现,而转移性癌症的原发来源可以在短时间内通过临床评估来确定。但是有一些肿瘤表现为一个或多个转移点,且其原发灶不明,即使医生用标准方法对患者进行全面的检查和评估研究,也无法找到肿瘤的主要来源,这类肿瘤称为原发灶不明转移癌(CUP)。医生对肿瘤患者的医治方案、医治过程及医治用
量子计算机拥有比经典计算机更加强大的计算能力,这样的计算能力主要是来自于被称为并行运算的量子特性。许多经典的NP难解问题都无法使用经典计算机强行求解,因为会使用难以接受的时间和空间资源。基于并行运算带来的强大计算能力,量子计算机可以求解一些已知的NP难解问题,因此大力研究发展量子计算机以及与之相应的算法就显得极具研究价值。目前在量子计算方向下关于量子计算机的研究主要从两个方面进行,一方面是量子算法