关于生物医学数据的聚类与分类算法研究及应用

被引量 : 0次 | 上传用户:vc__
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近年来一个十分活跃的研究领域。近几年,从事数据挖掘研发的人员遍布世界多个国家,数据挖据的研究重点也已从算法研究向具体应用过渡,从实验室原型走向商品化阶段。目前几种典型的数据挖掘研究是关联规则、分类、聚类、预测以及Web挖掘等。数据挖掘算法中的支持向量机算法,在通过若干学者的改进研究后,有一种改进算法即序列最小化算法主要应用于小样本数据集的分类,且分类效果较好,但在训练大规模数据集时,用时长、所需存储空间大,挖掘效率低。本文首先对数据挖掘的相关知识进行了介绍,以及二次开发平台WEKA的介绍,其次,对数据挖掘中的聚类算法和分类算法之一的支持向量机算法进行了仔细的介绍和推理过程,为糖尿病数据分析和序列最小化算法的推导做好了铺垫。接下来仔细介绍了糖尿病数据聚类分析过程,对现有的糖尿病数据集进行一些聚类实验,得出了一些相关结论。接下来仔细介绍序列最小化算法的原理和推导过程。再讨论了序列最小化算法的缺陷和不足,针对这一缺陷,本文通过改变存储策略改进该算法,在WEKA这个软件平台下,在保证分类正确率的前提下,缩短了训练时间,缩减了大量的存储空间,大大地提高了算法的效率,使其更加适应大规模数据集的训练。最后,对本文的研究进行了总结,并对未来进一步的研究工作进行了展望。
其他文献
随着社会的发展,建筑业将面临更加激烈的市场竞争,这就使建筑企业的战略管理显得尤为重要。面对越来越多、越来越强的竞争对手,以及日益严峻的市场发展形势,企业做大做强是一个必
根据多年来的发展现状来看,我国私募股权基金正处于关键发展时期,各大主体机构必须统筹规划、合理部署,力求促进私募股权基金的顺利发展,尽可能地为国家经济转型过程提供内在
随着石油勘探的发展,国内外发现的火成岩油气藏愈来愈多。国内外勘探表明,火成岩可以成为良好的油气储集层。火山岩作为一种特殊的油气储层类型越来越受到人们的关注与重视,
本文首先阐释了民法中诚信原则及其价值功能 ,进而分析了由于民事活动与民事诉讼活动的差异性等原因导致在民事诉讼中适用诚信原则必然存在的诸多问题。因此 ,对主张在民事诉
目的:对中国药典2010年版和2015年版微生物计数法进行比较分析。方法:采用两个版本药典微生物计数法测试15份同批次荆防颗粒剂中的细菌数及需氧菌总数,计算两个检验项目的平
<正>和法是中医学治疗八法中最常用的一种治疗方法,是指通过调和的手段达到治愈疾病的作用。和法具有调和表里、上下、气血、脏腑等多病位和阴阳、寒热、虚实等多病性的作用,
改革开放30多年来,民营经济成为我国经济体系的重要组成部分。不可否认,在我国有待进一步完善的制度环境下,政治、政府资源是企业发展的有效资源。相比于国有企业所具备的先天政
本研究采用反相微乳液法制备了纳米V2O5微乳液和掺杂稀土元素Ce的V2O5微乳液,选用活性焦AC1为载体,对其进行硝酸预处理得到催化剂AC2。将AC2分别浸渍于上述两种微乳液中,得到纳
宗“子午”针刺创独技守“灵龟”临证重候气──郑魁山教授传略及学术思想陈跃来甘肃中医学院(730000)主题词中医师,@郑魁山(甘肃),传记,中华人民共和国郑魁山教授,生于1918年,河北安国县人。幼年
翻开中国的历史不乏辉煌的历史,但是近100年的屈辱史也是赫然眼前。清朝末年至新中国的建立的近100年间,被迫签订了大量的不平等条约,这些条约都是侵犯中国主权和领土完整给近代