基于统计相关性网络的疾病关键基因的挖掘方法及其应用

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:laopoxqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文利用基因的Pearson相关性网络和最大互信息相关性网络的结构参数(聚类系数、平均度)分别挖掘肺动脉高血压以及1型糖尿病的结构关键基因。基于NCBI数据库中的GSE33463的30个特发性肺动脉高血压患者(叫作实验组,记为E)和41个健康人(叫作对照组,记为C)的基因表达谱数据进行显著性水平假设检验,筛选与肺动脉高血压相关的基因(276个),分别建立对照组和实验组中这276个基因的Pearson相关性网络,分析网络在不同阈值下的聚类系数,发现对照组和实验组的聚类系数全阈值可分。这表明对照组和实验组的基因网络结构存在差异。通过KEGG中代谢通路和文献资料分析全阈值下和(文献网络重构确定的)0.7阈值下平均聚类系数差异较大的前20个基因,发现它们主要与肿瘤癌症、免疫、特发性肺纤维化和血管生成相关。这与马普研究所(Max Planck Institute)的心肺研究所的科学家和德国肺研究中心认为由肺癌引发的炎症过程可能是导致肺动脉高压的观点一致。此外,基因ID1、LYPD3和HIPK1都与代谢通路TGF-betasignalingpathway有关,而基因BMPR2的此代谢通路已被认为与特发性肺动脉高血压有关。因此,基因ID1、LYPD3和HIPK1可能是影响肺动脉高血压的基因。基于NCBI数据库中GSE35725中的实验数据进行标准化等处理后,对实验组(糖尿病患者)和对照组(健康人)的基因表达谱进行显著性水平假设检验,筛选得到252个与1型糖尿病相关的基因。基于最大互信息相关系数建立与1型糖尿病相关的基因相关性网络。根据网络结构参数(平均度)挖掘与1型糖尿病密切相关的基因。对挑选的基因进行基因注释和文献分析,筛选出4个可能影响1型糖尿病的基因FPDS、HMGN1、NGLY1和FXYD1。本文通过构建统计相关性网络,利用生物基因网络的结构参数来挖掘相关疾病的致病机理,为生物学提供研究的依据。
其他文献
森林作为陆地生态系统的重要组成,参与全球的碳循环和水循环过程,对区域甚至是全球的气候变化影响深远。森林的生物量是估算森林碳储备、碳收支的关键参数,也是评价森林固碳能力的直接标志。近年来,环境问题越来越受重视,保护生态环境已经成为全球的共识,森林生物量反演的研究愈发热门。本文应用尺度生长与资源限制理论,结合实测的样地数据和气象数据,反演内蒙古大兴安岭森林地上生物量,主要内容分为两部分:区域最大树高反
杂色曲霉素(Sterigmatocystin)为含有双呋喃环的氧杂蒽酮类化合物,主要由杂色曲霉和构巢曲霉等真菌产生,杂色曲霉素被国际癌症研究机构归类为"2B类致癌物",具有肝毒性、肾脏毒
人们普遍认为,太阳上的活动表现出复杂的空间进化行为。北半球和南半球的太阳活动高度同步,形成了著名的“蝴蝶图”。然而,在最近的研究中发现太阳活动在北半球和南半球之间非常不同步。动态过程的南北异步是理解太阳活动区域的起源和演化及其在日面中的各种表现的重要主题。其中太阳黑子面积变化信号是太阳活动的一维表示方式,是非线性、非平稳的太阳活动信号,是太阳信息的载体。对于非线性、非平稳的太阳黑子面积变化信号来说
随着社会经济的不断快速发展,越来越多的有形产品在满足消费者的需求比重渐渐逐步下降,而服务价值却日益剧增,更多的企业将核心竞争从产品逐步扩大到以服务为中心,企业的服务竞争不仅是从售前售中的体验感觉上的较量,竞争也是蔓延到整个售后整体上的较量,所以当企业意识到竞争的激励时,都会将自己的侧重点放在建立适合自己企业产品的售后服务流程的制度和售后服务管理流程体验感上。随着国内经济的快速发展,国际市场的不断开
随着我国汽车保有量的急剧增长,城市交通路网承载着巨大的交通流量需求,当通行需求远大于路网承受范围时,路网将会发生拥堵,如果没有进行及时正确交通控制,拥堵将会一直扩散飘移,直至交通瘫痪。这几年,许多国内外学者开始从宏观层面利用宏观基本图(Macroscopic Fundamental Diagram,MFD)来对路网通行能力进行评估并设计出边界控制方案来控制区域路网的进出量,缓解路网通行压力。目前,
随着电子侦察所面临的环境愈发复杂。一方面,环境中存在着的大量雷达辐射源导致空域、频域、时域脉冲信号交叠严重;另一方面,环境中存在着大量新型复杂脉间调制雷达,其参数复杂多变,功能随战场应用灵活切换,对如今雷达信号分选系统提出了新的挑战。雷达信号分选也需要根据战场环境不断地进行发展及创新,以适应未来电子战战场。本文针对复杂电子侦察环境下信号分选所面临问题主要完成了以下内容:第一,对传统预分选流程进行改
本文将荆州地区作为研究区域,深入的研究和分析此地区家庭农场经营效率及其影响因素方面的一系列问题,希望本文章通过对此方面问题的探究,能够使家庭农场这个新型农业模式更加稳步快速的走向成熟。通过对国内外在相关理论研究的及基础上,本文升入研究探讨了家庭农场在经营效率上的问题,并且利用数据建立模型对其技术效率和规模效率进行了计算分析,从而得出各方面的影响因素。结论:(1)首先,随着家庭农场一些列支持政策的颁
现如今,随着电子技术突飞猛进的发展,各个领域的自动化程度以及安全性问题也得到了高度的重视。基于火电厂的人脸识别技术,结合火电厂的检修管理系统,舍弃掉繁琐的纸质版检修工作流,重新整合出一套完整的包含考勤的电子版缺陷处理管理系统。这样能够彻底解决传统打卡中存在的代打卡,并可以减少缺陷处理过程中由于人员办理相关手续所浪费的时间,提高办公效率,达到考勤管理运维一体化的效果,减轻检修人员的工作量,提高工作效
空调器实际在用户家使用时,低气压环境下较小的空气密度会降低蒸发器空气侧换热系数,较小的空气绝对含湿量造成潜热换热量的减小。而在空调测试过程中,为维持测试工况,低气压
利用经典分析工具“Abel分部求和引理”,本文系统研究一个三次一般超几何级数及其部分和,建立若干与之相关的变换关系与求和公式,推广了一些已知结果,也获得一个新的三次非终止型7F6-级数求和公式.前言部分详细介绍一般超几何级数的相关概念、发展历史以及研究现状,并详细阐述本文主要研究工具“Abel分部求和引理”.第二章利用Abel分部求和引理证明一个新的含3个自由参数的三次非终止型7F6-级数求和公式