基因芯片设计与数据处理中的若干关键问题研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:chentongxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片技术的应用给现代生物学研究带来了巨大的变革。其出现和发展是多学科交叉的结果,其中一些关键问题的解决强烈依赖于生物信息学研究的支持,特别是基因芯片设计和数据分析问题。围绕基因芯片设计和数据分析问题,本文重点研究了:大规模细菌检测16S rRNA基因芯片探针设计和基因芯片表达谱数据分析。探索微生态系统中的生物多样性是元基因组学研究的重要内容,面对未知环境样本,快速准确地鉴定其中细菌的种系构成,研究细菌的广谱检测方法具有十分重要的应用价值,这项技术在复杂微生物菌落分析、微生物环境监控等领域具有广阔的应用前景。随着16S rRNA序列资源的不断丰富,以及寡核苷酸微阵列基因芯片技术的不断进步,设计大规模细菌检测16S rRNA基因芯片,分析未知环境样本中的微生物种群的种系构成成为可能。大规模细菌检测16S rRNA基因芯片设计问题的关键是探针的优化设计,首先,探针优化设计的基础是对寡核苷酸杂交行为的准确预测。采用计算的方法分析核酸分子在溶液中杂交反应的热力学性质具有很好的效果,然而,当杂交产生的双链体中有一个单链核酸分子一端固连于芯片表面时,这种复杂的固连效应会对探针捕获目标核酸分子过程的动力学和热力学分析产生较大的影响,降低了预测杂交稳定性的准确性。通过对大量杂交实验数据的统计分析,我们发现将完全匹配(perfect match,PM)探针和相应的错配(mismatch,MM)探针的杂交结合自由能相减,能在一定程度上消除这种固连效应对计算预测的负面影响。因此,针对每个探针设计阳性对照点能有效提高基因芯片对特异性和非特异性杂交的分辨能力。在设计大规模细菌检测16S rRNA基因芯片的过程中,所有的目标序列依据细菌分类学划分为多组。在一个分类单元中存在多种16S rRNA基因的拷贝,这就需要针对每个分类单元设计组特异性探针。已有的组特异性探针设计方法大都是基于全局序列对齐的,计算复杂度较高。本文设计了一种OligoSampling算法,使用MCMC方法进行组特异性探针设计。该方法不需要首先将序列全局对齐,而且具有更高的效率和灵活性。能够针对细菌分类单元设计组特异性探针,还不足以解决大规模细菌检测16S rRNA基因芯片设计问题。对于依据细菌分类学定义的一组16S rRNA序列,组内的目标序列相似但不完全相同,设计单个组特异性探针检测组内所有目标序列是很困难的。因此,本文进一步研究了设计多个探针通过组合方式进行细菌检测。每个探针能够特异性地检测组内一部分目标序列,通过组合(各个探针按照逻辑“或”的方式进行组合,任何一个探针检测出阳性信号即表示检测到目标菌种)就能够提高覆盖率。面对探针组合优化问题,本文提出了一个可行的基于相对熵和遗传算法的组合探针设计算法。将上述方法应用于大规模16S rRNA细菌检测基因芯片设计,结果表明设计的组特异性探针组具有很高的特异性和很低的交叉杂交发生率。针对某个菌种设计特异性探针组时,如果在进化过程中,其他不相干的菌株发生了多碱基突变,就可能与探针组中某个探针发生特异性杂交,这将对检测结果产生干扰。但是,组外的菌株在16S rRNA的多个位点上都通过多碱基突变而与多个组特异性探针均发生交叉杂交的可能性极小。基于以上事实,本文还研究了着眼于提高检测特异性的检测策略,即将多个探针按照逻辑“与”的方式组合(所有的探针都检测出阳性信号即表示检测到目标菌种)。我们首先使用OligoSampling算法设计组特异性候选探针,然后将多个候选探针按照逻辑“与”的方式组合成一个检测单元,再将多个检测单元按照逻辑“或”的方式组合起来检测目标菌种。结果表明,按照这种方式组合探针,也能够在保证特异性的基础上获得很高的覆盖度。一般的表达谱基因芯片数据处理方法包含两个步骤:标准化和差异表达基因识别。差异表达基因的存在,特别地,当上调的差异表达基因与下调的差异表达基因在数量上存在较大差别时,这会对标准化的准确性产生负面影响。而标准化的结果又会影响到差异表达基因的识别。对于一个两步过程——差异表达基因识别和标准化,无论哪一个先做,都会将误差累计到下一步。本文提出了一种新的基于迭代重选择算法的野点剔除方法,并将其应用于表达谱数据标准化。仿真和真实数据的分析结果表明,本文提出的方法能够在一个迭代过程中,逐步消除野点的影响,有效地提高表达谱数据标准化的准确性,并同时准确地识别差异表达候选基因。将该方法应用于啤酒酵母氨基酸缺乏培养表达谱数据,本文发现了与原始论文不一样的生物学结论,在参与碳水化合物代谢过程的基因中,同化酶的诱导先于异化酶的诱导,而不是两种酶同时诱导。
其他文献
目的探讨柠檬苦素(limonin)对自然衰老大鼠学习记忆能力及因衰老而导致机体氧化损伤的影响。方法采用18月龄雄性SD大鼠作为自然衰老模型,随机分为衰老对照组和Limonin组(50、
环氧树脂具有优秀的附着力、耐热性、耐化学品性、绝缘性与机械强度等性能,因此其在防腐涂料领域应用广泛。但传统环氧树脂涂料以有机溶剂体系为主,制备和使用过程中会释放大
师范院校学前教育专业的培养目标是未来的幼儿教师,该专业学生音乐素养能力的高低直接影响到幼儿教师事业的健康发展。本文分析了当前师范类学前教育专业学生在音乐能力发展
分析了新中式风格建筑在实际住宅建造中的应用,重点介绍了住宅风格发展的历史和现在的形式,不仅能够实现文化的传承,更能实现对于住宅的稳定性,希望可以为我国的住宅建筑发展
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
尊敬的各位来宾,女士们、先生们: 由中国中山大学、广东省英德市人民政府、广东省博物馆共同举办的国际学术盛会──中石器文化及有关问题国际学术研讨会,今天在我市隆重召开了!
杂草是在田园中对目的植物的生境造成干扰的非目的植物,作为外来有害生物,杂草主要是以杂草种子的形式,通过混杂在农林作物种子和粮食等植物产品中传入我国,已经对国民经济和
作为一种无损可视化测量手段,电学层析成像技术因其价格低廉、响应快速,在工业和医学领域具有重要的应用价值。目前,电学层析成像大多表现为单模态成像,且成像过程依赖于有限
阳春三月,笔者作为对辽宁省中小学教师队伍质量和师资培训工作情况抽样调查组成员来到朝阳市,通过听课、座谈、读教案、参观等多种形式对市内和叶柏寿地区十四所中小学进行了