【摘 要】
:
为提高特征提取方法的文本分类精确度,结合信息增益(IG)和改进的最大相关最小冗余(mRMR),提出一种IG_CDmRMR二阶段文本特征选择方法。通过IG提取与类别相关性较强的特征集合,
【基金项目】
:
国家自然科学基金(61302155,61276429)
论文部分内容阅读
为提高特征提取方法的文本分类精确度,结合信息增益(IG)和改进的最大相关最小冗余(mRMR),提出一种IG_CDmRMR二阶段文本特征选择方法。通过IG提取与类别相关性较强的特征集合,利用类差分度动态改变mRMR中特征与类别之间的互信息值权重,并筛选最优特征子集,从而得到文本分类结果。实验结果表明,与IG方法、IG_mRMR方法相比,在特征数量相同的情况下,该方法可使准确率提升约2 %。
其他文献
随着经济建设的迅速发展,危险化学品的各类事故频频发生,造成了极其惨重的损失和较大的社会影响,如何处置危险化学品,是消防指挥员要重视的问题。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
总量控制是我国一项重要的环境保护制度,但由于其影响因素复杂,一直没有较好的方法来全面评价地区总量控制水平。本文基于灰色系统理论,利用灰色关联度建立了主要水污染物总量控
[情境任务]新年的脚步越来越近了,在元旦这个举国欢庆的节日即将来临之际,我们班将举行一场欢乐美食聚会。每个人需准备一份美食,然后将每道美食汇聚在一起,组成美味的自助餐
现有能量捕获无线传感器网络路由方案较少考虑链路质量以及节点能量是否足够等问题。为此,对能量溢出感知的剩余能量最大化路由问题进行建模,结合储能设备上能量溢出浪费情况
基于新安江模型,利用GIS技术和相似性分析开展流域无资料情况下的水文模拟。在提取流域特征值的基础上,通过相关分析、聚类分析等方法判定相似流域,有效地分析了模型参数与流域
角形因数的指标对于控制原砂质量,提高型砂流动性和成型性具有指导意义。选取13个硅砂样品,利用比表面积测定仪,通过两种方法计算铸造用硅砂的角形因数,对其结果进行讨论,并
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
病例导入式教学法(case based study,CBS)是以学生为主体,在教师的指导下,以病例为核心进行研究性学习的教学方法。听力学专业《耳鼻咽喉科学》教学中实施病例导入式教学法可以
错拼抢注域名是一种典型的抢注域名,投机者注册的主要目的是用其营利,随着注册数量的不断增长,错拼抢注域名对用户上网造成的影响El益严重。为此,对错拼抢注域名相关研究工作的最