用Boosting方法组合增强Stumps进行文本分类

来源 :软件学报 | 被引量 : 0次 | 上传用户:wangzhanglu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高文本分类的精度,Schapire和Singer尝试了一个用Boosting来组合仅有一个划分的简单决策树(Stumps)的方法.其基学习器的划分是由某个特定词项是否在待分类文档中出现决定的.这样的基学习器明显太弱,造成最后组合成的Boosting分类器精度不够理想,而且需要的迭代次数很大,因而效率很低.针对这个问题,提出由文档中所有词项来决定基学习器划分以增强基学习器分类能力的方法.它把以VSM表示的文档与类代表向量之间的相似度和某特定阈值的大小关系作为基学习器划分的标准.同时,为提高算法的收敛速度
其他文献
目的探讨重症监护病房COPD患者机械通气时间的因素。方法选取重症监护病房进行机械通气治疗的54例COPD患者为研究对象,根据机械通气时间分为A组(≤7d组)18例、B组(8~14 d组)18例和
提出一种用于光线与三角形网格求交运算中的有效剔除算法.算法中,一根光线被定义为两个非平行平面的交线.针对由稠密三角形网格组成的复杂场景,算法通过三角形和测试平面的相