一种基于CFN的特征选择及权重算法

来源 :微计算机信息 | 被引量 : 0次 | 上传用户：radar14015

【摘要】

：

利用TF和DF的组合进行特征选择,及利用TF-IDF算法计算权重,是文本分类中常用的算法。但当训练集较小时,此特征选择算法会将一些特征区分能力强的低频词过滤掉,并直接影响特征

【作者】

：

柴忠常晓明

【机构】

：

太原理工大学计算机与软件学院

【出处】

：

微计算机信息

【发表日期】

：

2009年3期

【关键词】

：

文本分类特征选择小训练集权重汉语框架网络 text categorization feature selection small training

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

利用TF和DF的组合进行特征选择,及利用TF-IDF算法计算权重,是文本分类中常用的算法。但当训练集较小时,此特征选择算法会将一些特征区分能力强的低频词过滤掉,并直接影响特征词的权重。本文提出一种基于汉语框架网络（以下简称CFN）的特征选择和计算权重的算法。实验表明：算法可使分类的准确率达到67.3%,较传统算法有很大提高。也说明了该算法能够满足小训练集环境下对文本分类准确率的要求。

其他文献

浅谈思政教育在高校教学中的应用

摘要：思想政治教育是社会或者社会群体采用一定的思想观念、政治观点以及道德规范，对成员进行有目的、有计划、有组织的影响，让他们逐步形成符合一定社会所要求的思想品德的社会实践活动，同时也是中国文学之中一门终身学习的课程。如今，高校对学生的思想政治教育越来越重视，以求完善其个人价值观念等思政意识，同时为解决当前高校实施思政教育的局限性，“课程思政”提出将思政教育融入其他课程的学习，二者同向同行、协同作

期刊

思政教育高校教学课程思政

子宫内膜病变临床病理诊断中的差异性

目的探讨临床病理诊断在子宫内膜病变术前后的差异性。方法回顾性分析225例子宫内膜病变患者的临床病理资料,了解手术前后病理诊断及病理分级的差异性并分析原因。结果手术前

期刊

子宫内膜癌差异性病理诊断

左卡尼汀与参麦注射液联合治疗缺血性心肌病心力衰竭的疗效分析

目的探讨左卡尼汀与参麦注射液联合治疗缺血性心肌病心力衰竭的临床效果。方法将126例缺血性心肌病心力衰竭患者分为观察组（65例）和对照组（61例）,对照组实施降脂、抗凝、抗心肌缺

期刊

左卡尼汀参麦注射液缺血性心肌病心力衰竭

一种基于CFN的特征选择及权重算法

其他学术论文