结合优化文档频和变精度粗糙集的特征选择方法

来源 :河南大学学报:自然科学版 | 被引量 : 0次 | 上传用户:antony86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类中,特征空间的维数通常高达几万,甚至远远超出训练样本的个数,这是一种十分普遍的现象.为了提高文本挖掘算法的运行速度,降低占用的内存空间,过滤掉不相关或相关程度低的特征,必须使用特征选择算法.首先给出了一个基于最小词频的文档频方法,然后把变精度粗糙集引入进来并提出了一个基于信息熵的属性约简算法。最后把该属性约简算法同基于最小词频的文档频方法结合起来,提出了一个综合的特征选择算法.该综合算法首先利用基于最小词频的文档频方法进行特征选择,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.
其他文献
沧州农业银行针对中小企业贷款难现状,打破传统信贷模式,创新信贷产品和操作流程,使中小企业“进得来”、贷得到、贷得快。今年以来,共审批中小企业88户,授信金额7.16亿元;实际发放
学习进阶可以描述学生思维发展的轨迹,揭示学习进程和思维发展规律。测评工具研发是学习进阶的重要组成,研发不足会制约学习进阶的研究与应用。该研究的目的是采用学习进阶理
为深入贯彻《中共中央国务院关于进一步推进农垦改革发展的意见》,光明食品集团上海五四有限公司(以下简称“五四公司”)按照集团“着力培育扶持一批有品牌、有技术、有市场
该文通过对特大径筒仓结构滑模施工技术进行介绍和总结,为今后类似条件的工程施工提供实践经验和科学依据。
研究了外源水杨酸(SA)对Cu^2+胁迫下小麦幼苗中活性氧(ROS)和主要抗氧化酶——超氧化物歧化酶、过氧化氢酶、抗坏血酸过氧化物酶和谷胱甘肽还原酶活性的影响.结果显示,与对照相比,Cu^
研究分数阶Rikitake系统的混沌动力学行为.数值模拟证明分数阶Rikitake系统存在混沌,并且得出分数阶Rikitake系统能产生混沌吸引子的最低阶数为2.94阶.利用线性反馈控制法研究了
大家都知道,高层建筑往往存在各种质量缺陷,而给排水系统尤其突出,各方予以高度重视,各参建方采取切实可靠的措施,保证给排水工程施工质量。本文是通过对施工过程中的事前控制,事中
2012年,我22岁。告别了母校,惜别形影不离的室友,我陷入了前所未有的迷茫和毕业就失业的恐慌。我开始小心翼翼地赶赴各种招聘面试。那天突然接到了一个电话。"是许赫吗?你面试