【摘 要】
:
基于基因表达谱,在分子水平上对肿瘤进行分析和研究是当前生物信息学研究的重要课题。本文从系统科学和信息科学的角度,采用模式识别,机器学习和计算机技术,从胃癌与胃正常组
论文部分内容阅读
基于基因表达谱,在分子水平上对肿瘤进行分析和研究是当前生物信息学研究的重要课题。本文从系统科学和信息科学的角度,采用模式识别,机器学习和计算机技术,从胃癌与胃正常组织的样本分类入手就胃癌分类特征基因的选取问题进行了分析和研究,并取得了如下成果:
第一,针对胃癌分类特征基因选取的研究本文将RFE_Relief方法应用到了胃癌特征基因选取上。该方法是在Relief方法的基础上借鉴递归特征排除(Recursive Feature Elimination,RFE)策略得到的。利用RFE_Relief方法进行分类特征基因的选取时,首先计算基因集合中的所有基因的分类权重,去掉具有最小权重的那个基因,然后重新计算剩余基因的权重,再去掉具有最小权重的基因,如此循环下去。通过实验选取出了10个具有较好分类能力的特征基因。与目前其他特征基因选取方法(如S2N、t-test、Relief_A、RFE_Relief)相比较,结果表明RFE_Relief方法选取出的基因个数更少,包含的分类信息更多。
第二,针对胃癌预测模型的研究本文进行了胃癌预测模型的研究,并建立了两种胃癌预测模型,分别为k-近邻法模型和支持相量机(SVM)模型。利用上一步确定了的10个基因的特征集合来验证这两种预测模型上的分类准确率,结果表明这两种预测模型均可取得百分之百的预测准确率。该结果表明了上一步所选特征基因具有良好的样本分类能力。
本文的研究有助于胃癌与基因关系的理解,有助于胃癌分类特征基因的选取,胃癌的分类。
其他文献
在工业现场环境下,监控设备与Internet相结合,可使本地计算机通过Internet网络,实现对远程终端进行监视和控制,完成对分散控制网络的状态监控及设备的诊断维护等功能。无线通
本文研究音频信号在金属材料内部的传递规律,把横向振动引入到音频检测中,根据压力容器结构、强度性能参数与音频参数建立数学模型,与标准的压力容器质量参数进行对比,将压力
DeviceNet作为现场总线的国际标准之一,已日益成为人们的关注焦点。因此,开展基于DeviceNet从节点开发技术的研究就显得十分紧迫和必要。本文在充分研究DeviceNet协议规范的
现如今,依托于各领域科技的快速发展,多项工业难题逐渐被攻破,越来越多的先进技术应用于实际的工业生产之中。工业过程逐渐朝着信息化的方向迈进。在实际的工业生产过程中,通
当前我国多数啤酒生产厂家正在向每小时四万瓶以上的生产线方向发展,在这种速度下依靠人工检测将变得异常困难,这就迫切需要有对瓶子进行在自动检测以满足市场需要。 由于玻
本文研究了随机非线性系统的最优控制设计问题,给出了基于性能势的在线优化算法。性能势函数通过系统样本路径进行估算,优化控制可以利用基于性能势的优化方程迭代计算获得。
随着电力电子装置的广泛应用,由整流器引起的电网谐波污染日益严重,消除谐波污染、提高功率因数,一直以来都是电力电子技术中的重要课题。论文研究的主要内容是PWM整流器的控制算法,通过对控制算法的改进,提高PWM整流器能量变换的效率,达到减小谐波含量、提高功率因数的目的。在分析了现有算法控制效果的基础上,讨论了将不同控制效果的算法结合在一起的可能性和必要性。提出一种以交流侧电流值为参考变量的“双滞环”方
电力系统无功的合理分布是保证电压质量和降低网损的前提条件,电力系统中无功优化的调整,将对电力系统的安全经济运行产生重要作用。因此,对电网进行无功优化,是一个既直接影响系统电压质量,又关系到电网经济运行的重要问题。本文考虑动态无功优化问题,把一天24小时内的系统网损最小作为目标函数,并考虑无功补偿装置的调节代价。动态无功优化的难点在于实际负荷时刻处于连续变化之中。本文利用负荷分时段控制来解决设备动作
在工业过程控制中,被控对象往往存在不同程度的时滞。时滞的存在往往会使控制效果变差,系统稳定性降低。解决时滞问题的关键是对输出的预测,故近年来预测控制成为时滞系统控制的