基于异构网络的致病基因预测方法研究

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:ttcj_008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成,人类进入了“后基因组时代”,该计划让人们对疾病有了全新的认识,即大量疾病的发生都与基因有关,因此寻找疾病相关基因成为了目前认识疾病发生机理、研制疾病基因诊断与防治手段的重要课题,同时致病基因的研究对改善医疗护理、延长病人存活周期和药物靶标发现等方面具有重大的指导意义。借助计算手段的致病基因预测研究成为当前乃至未来的生物信息学研究的主要内容。现有的致病基因预测方法受限于表型数据不足及复杂网络结构的影响,预测方法性能存在着一定提升空间,针对解决以上两个问题,本研究主要工作有:针对表型数据不足的问题,本文重构了表型相关网络。首先处理现有的表型相关数据集,得到部分表型相关关系,然后利用自然语言处理技术增添了新的表型关联数据,将扩展后的表型数据构成表型网络,应用网络嵌入算法将表型节点映射成向量,利用向量间距离重构了表型相关网络。针对复杂网络结构信息问题,本文提出了基于网络嵌入算法的可选式致病基因预测方法框架,共包含三个步骤:(1)结合扩展的表型关联数据,蛋白质交互数据,蛋白质—表型关联构建了蛋白质—表型异构网络。(2)基于可选式网络嵌入算法(Deepwalk或Node2Vec)产生网络节点向量。(3)计算表型节点向量与基因节点向量的余弦相似度,相似度排序较高的基因被预测为致病基因。实验结果表明,本研究扩充了表型相关数据,所提出的致病基因预测方法通过弃一法交叉验证表明该方法提高了致病基因预测的性能,且比现有其他方法性能有所提高。
其他文献
[目的]明确吡唑醚菌酯和苯醚甲环唑混合对花生褐斑病毒力增效作用。[方法]室内联合毒力测定和田间药效试验。[结果]筛选得到吡唑醚菌酯与苯醚甲环唑的增效型混剂。[结论]吡唑
习作评改是作文教学之中一项重要而繁重的工作,只有调动起学生自评互改的积极性,教给评改方法,才能让学生在一次次互评自改中提高写作能力,提升语文素养。在教学中,教师要引
【正】 近几年随着体育科学研究的深入,一些重要的基础理论也不断充实了大量新的内容而且新的理论很快被人们引入了各个运动项目的基本理论和实际训练中广大教练员和科研人员
创业企业属性特征决定了创业者成为影响其成长的关键因素。作为创业者情感的集中体现,创业激情能够帮助创业者识别潜在的信息资源和开发创业机会,在创业过程中占据重要地位。
偏远山区农村教育发展滞后,并非个性原因所致。教师队伍素质以及办学条件是制约教育质量提升的关键性因素。转变目前偏远山区农村教育落后现状,需要从改善办学条件和提高教师
目的:评估应用中西医结合的方法治疗慢性阻塞性肺疾病急性发作期(AECOPD)气道黏液高分泌的疗效。方法:将384例AECOPD气道黏液高分泌的患者随机分为两组。治疗组(192例)采用西医常规
新时代公立医院要加强内部控制。当前公立医院内部控制存在重视不到位、专业性强、内控体系不健全以及计算机技术运用不到位等问题。对此公立医院应高度重视内部控制,提供必
随着时代的不断发展,越来越多的高职院校开设了英语专业,力求为社会培养更多的英语人才。虽然高职院校在英语教学方面采取了不少改革措施,但从目前来看,高职院校英语专业学生
本文将从观赏史铁生散文意象入手,通过他所构筑的能够集中反映其心路历程的三个典型意象———“墙”、“孩子与老人”、“地坛”来透视那些由其心灵深处升华出的具有理性意
随着河南城市化进程的加快,大量的农业用地被征用,越来越多的农民成了失地农民,其中一部分成为新的困难群体,面临"种田无地,就业无岗"的境遇。对于农民来说,失去了土地,就意