特征选择在中医数据挖掘中的应用研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:vinejue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中风病领域中,证候和四诊是两个常见的术语。证候是指人体在疾病发展过程某一阶段所出现的一组有机联系症状的病理概括;四诊是望诊、闻诊、问诊和切诊的总称,其中包含有几百个小项,例如:咳嗽、抽搐、头痛等,它们是中风病正确辨证和有效治疗的前提。中风病辨证就是将四诊(望、闻、问、切)所收集的有关疾病资料,包括各种症状、体征等,加以分析、综合,判断为某种性质的“证候”,以探求疾病的本质。一直以来,中医界使用的中风病的诊断标准是九十年代基于专家经验所制定的。经过十余年来的临床实验,发现该诊断标准存在一定的局限性。因此,中医中风病研究人员希望借助数据挖掘手段,从已经采集的中风病病例数据中得出基于数学方法的更客观准确的诊断标准。本论文基于国家重点基础研究发展计划(973计划)课题“缺血性中风病证结合的诊断标准与疗效评价体系研究”,以中风病诊疗为背景,借助课题前期开发的管理信息系统的数据,运用特征选择方法挖掘新的中风病证候诊断标准。建立中风病证候诊断标准本质上是找出中风病各个证候所属的四诊信息项,这个过程与数据挖掘中特征选择的过程十分相似,因此本文采用的是特征选择算法。特征选择作为模式识别和机器学习领域重要的研究方向,在对高维度数据的降维以及大规模数据处理方面有着重要的应用。对海量的高维度数据使用特征选择方法,一方面可以提高分类及聚类的精度和效率,另一方面可以找出富含信息的特征子集,减少数据冗余。因为医学数据挖掘的特殊性,在应用特征选择方法时相应的进行了一些改进。在特征选择算法框架的基础上,论文先后设计了4种主要的特征选择方法。其中涉及到的基础算法有遗传算法,关联分析以及KNN算法。这四种主要的特征选择方法如下:(1)遗传算法结合关联分析的特征选择;(2)基于遗传算法的自适应增强算法;(3)遗传算法结合KNN的特征选择方法;(4)基于权重的特征选择。这4种特征选择方法彼此之间是递进的层次关系,论文对每个方法的结果都进行了横向的对比和评价。对每种算法中存在问题的进行了仔细的分析,进而对算法进行有效的改进,最终得出了比较满意的算法性能和结果。论文中针对KNN算法时间复杂度问题的改进是论文的最主要的创新点之一,通过对KNN算法复杂度的分析,找出影响其时间复杂度的主要因素,并结合具体的数据对象进行算法的改进。改进后不仅降低了算法的时间复杂度,而且还使得算法的效果得到了提高。
其他文献
在电力系统的运行中,同步发电机的励磁控制对整个系统的特性起着重要的作用,性能优良的励磁控制系统能够有效地保证电压的质量,提高电力系统运行的稳定性,与其它为提高电力系统的稳定性而采取的措施相比,励磁控制具有投资少、易于实现等特点。直接反馈线性化方法属于线性化方法的一种,这种方法的基本思想也是首先把非线性系统转化为线性系统,然后对线性化后的线性系统来设计控制器,这样,就不需要进行复杂的坐标变换,直接便
针对目前难成型、大直径和复合材料铆钉的铆接难题,提出以电磁感应加热和电磁铆接相结合的电磁热铆接方案,用于我国飞机制造和维修中。电磁铆接作为一种新型铆接工艺,已经应用于
传统的信息由于缺乏统一的语义描述,充斥着大量繁杂重复信息,面对这些海量信息,如何快速、有效地从“信息海洋”中获取人们所需的信息成为难题。让信息具有语义,使计算机能够
电力系统自动化是电力系统一直以来不断努力发展的方向。电力系统自动化包括发电控制自动化、电力调度自动化以及配电网自动化。其中,电力系统的配电环节是面向电力用户的一个重要环节,配电设备性能的高低、质量的好坏决定了电力系统是否可以安全、平稳运行。论文以一种配电自动化远方终端的开发为背景,对远方终端的关键技术进行研究,在基于自主可控的国产芯片的基础上,完成了具有数据加密传输功能的高性能安全测控终端的设计。
随着过去十几年移动器人技术的快速发展,移动机器人在人类生活中扮演着越来越重要的角色。移动机器人可以代替人类去完成一些危险的工作,特别是在一些人类无法到达的环境中。
经络是中医基础理论的组成部分,为中华民族的健康和发展做出了巨大贡献。腧穴分布在经络上,是人体气血输注出入的地方。其中,背俞穴位于背腰部足太阳膀胱经第一侧线上,依脏腑
载体催化瓦斯传感器以其灵敏度高、测量浓度范围宽、体积小、价格低廉等优点,在我国煤矿矿井中被广泛地应用。然而,由于受传感器结构、材料、催化剂活性衰减等因素的影响,该类瓦
作为当今人们在工作和生活中不可或缺的设备之一,计算机技术在近半个世纪以来取得了诸多的成就,如体积越来越小、计算能力越来越强、数据共享和交流越来越频繁等。但是,人机
智能卡操作系统(Chip Operating System,简称COS)是智能卡在软件层面的核心技术。其研究和开发对智能卡技术的发展和普及有很大的促进作用。国内各卡商大多开发基于Native的C
三维地形匹配这个概念,在上个世纪70年代就开始有人提出,之后得到了学者的关注并深入研究,使得地形匹配发展迅速。从最初的理论逐渐到应用,甚至应用于国防,发展我国的国防建