一种基于互信息的基因数据特征选择算法

来源 :信息与电脑 | 被引量 : 0次 | 上传用户:star010lxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是目前威胁人类生命的重大疾病之一,若能早期发现,则会极大地提高治愈率.针对现在绝大多数特征选择算法都依赖于排除冗余高的特征而没有考虑到特征冗余也可能产生良性影响的问题,笔者提出一种将MIM与CIFE结合的算法.实验结果表明,该算法优于一些其他算法,具有较好的分类精度,对选择出与癌症发病高度相关的基因具有正向作用.
其他文献
本文简要介绍了红外触摸屏技术的优势、实现原理以及在多点识别领域大规模应用亟需解决的问题,并对重点问题“轨迹跟踪”和“抗锯齿”作了说明,指出该问题的由来以及目前算法的缺陷和不足.为解决该问题,本文提出了一种基于目标跟踪的数据关联算法,该算法利用卡尔曼滤波预测下一个触摸点状态,在预测点建立跟踪门,并进行数据关联.最后本文对该算法进行了 MATLAB模拟仿真,并进行了实际工程对比.通过前后效果的对比,证明该方案在多点触摸识别领域具有很好的触摸效果.
本文以NURBS曲面为研究对象,提出基于序列二次规划算法(Sequential Quadratic Programming,SQP)的NURBS曲面轮廓度误差评定模型.首先,根据给定的控制点和节点向量构造NURBS曲面,并采用分割逼近法计算测点到该曲面的最小距离及其对应最近点;其次,结合距离函数的微分运动模型,采用SQP算法实现测量点集和理论曲面的最佳匹配,进而得到曲面的轮廓度误差;再次,考虑到测量点集的有限性,重构测量曲面,可得测量曲面上任意一点到理论曲面的最小距离;最后,利用MATLAB软件进行了仿真
多模态话语分析旨在研究某一情境下符号资源对思想文化交流与传播的促进作用,是对包含多种社会符号的语篇的深入研究.然而,先前的研究对象多集中在文字和静态图像,对动态图像比如宣传片的研究甚少.该研究以视觉语法为理论框架,选取了 2010-2020年奥运会举办城市的申奥宣传片为研究对象并利用ELAN视频编辑软件进行切割与编码,共计651帧.研究发现,该类宣传片普遍使用侧面视角和长镜头等方式展现奥运风采、风景名胜、传统美食、文化习俗、生活方式、科技经济和人文色彩几大主题,主要元素常置于中心位并通过不同方式与次要元素
本文设计并分析了一种仿蜂巢结构吸液芯,并对其流动与换热特性进行了研究.该吸液芯是由多个仿蜂巢结构的六边形槽道组成的仿蜂巢分形结构,其中由蜂巢沟道包围的凸台区构成了多孔介质区.在的相同工况下进行数值模拟研究,结果表明:仿蜂巢结构在流动与换热方面要优于平行结构,具有优良的传热传输性能;仿蜂巢结构吸液芯在防阻塞方面起着独特的作用;在此基础上,带多孔介质的渗透结构比传统流道结构的散热性能优异.本研究为之后仿蜂巢结构吸液芯的实验研究提供了支持.
针对电力负荷呈现出非线性的特性所导致预测精度不高等问题,本文提出基于VMD-QPSO-BiLSTM的短期电力负荷预测方法.首先,采用变分模态分解(VMD)降低负荷序列的非平稳性和复杂度;其次,基于量子粒子群算法(QPSO)改进的双向长短期记忆网络(BiLSTM)的方法进行预测;最后输出分解结果.另外,进行对比实验测试,实验表明本文所提的模型相比其他智能算法模型可以取得更高的预测精度.
图像分割是计算机视觉的重要组成部分.其中,交互式图像分割是向计算机提供有用的先验知识,GrabCut交互式图像分割中是经典算法,其在用户交互过程中使用的涂鸦、画线、方形盒等交互方式给用户操作带来不便.针对上述问题,提出一种基于极值特征的交互式图像分割算法.首先,用户在图像中标记目标区域的顶部、最底部、最左侧和最右侧的极值点,利用算法求解出以极值点为顶点的极值框;其次,以极值框内选取的图像作为前景图,极值框外的为背景图;最后,确定了 Grabcut的初始分割前景和混合高斯模型参数.采用最小割算法对前景图像进
目的 探究《傅青主男科》中治疗小儿疾病的处方用药特色及规律.方法 从《傅青主男科》中提取小儿疾病的医案方药信息,建立“《傅青主男科》治疗小儿疾病用药的Microsoft Excel数据库”,分析药物的气味与归经;同时SPSS 25.0进行系统聚类分析,SPSS Modeler 14.1关联规则分析.结果 共36个方,63味中药,频数≥2次的药物27味,排名前10为甘草、茯苓、柴胡、白术、白芍、当归、半夏、山楂、人参、黄连,累计使用151次,其中补益脾胃、调畅气机药使用频率较高;四气主要有寒、温、平;五味主
目的 研究华蟾素胶囊联合化疗治疗晚期肺癌患者的价值.方法 选择医院2016年1月-2020年9月收治的280例晚期肺癌患者,根据简单随机法分为对照组140例(化疗)和观察组140例(华蟾素胶囊联合化疗),并通过QOL生活质量评定量表分析两组患者治疗前后的生活质量水平,统计两组患者不良症状(血小板减少、肝功能损伤、中性粒细胞减少),同时通过改成酶联免疫吸附剂测定(ELISA)法和流式细胞仪对两组的血清基质金属蛋白酶9(MMP-9)、金属蛋白酶组织抑制因子-1(TIMP-1)水平和CD3+、CD4+、CD8+
针对现有shapelets分类方法不能解决不平衡时间序列分类的问题,提出了基于多样化top-k shapelets转换的时间序列分类方法,用不平衡数据分类评价指标曲线下面积(Area Under Curve,AUC)代替传统的信息熵,作为衡量shapelets的标准,并利用多样化top-k shapelets对训练集进行转换,最后使用SMOTE方法对转换后的训练集进行过采样.该方法利用AUC值对不平衡数据不敏感的特性,提高shapelets特征评估分类的准确性,不仅可以有效提取时间序列特征,还能在特征的基
半监督学习可以利用少量的先验信息来更好地进行模式识别的工作.而标签传播算法是半监督学习中的研究热点之一.在半监督聚类的应用场景下,本文的算法以局部表示假设为基础,进一步地与秩约束聚类方法相结合,并提出了一种有效的半监督聚类框架.此外,本文提出一种可将半监督的成对约束信息在生成图上进行标签传播的方法.