用Boosting方法组合增强Stumps进行文本分类

来源 :软件学报 | 被引量 : 0次 | 上传用户：wangzhanglu

【摘要】

：

为提高文本分类的精度,Schapire和Singer尝试了一个用Boosting来组合仅有一个划分的简单决策树(Stumps)的方法.其基学习器的划分是由某个特定词项是否在待分类文档中出现决定

【作者】

：

刁力力胡可云陆玉昌石纯一

【机构】

：

清华大学,清华大学

【出处】

：

软件学报

【发表日期】

：

2002年8期

【关键词】

：

BOOSTING方法文本分类机器学习 Stumps分类器 Algorithms Classification (of information) Learni

【基金项目】

：

国家自然科学基金，国家重点基础研究发展计划(973计划)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为提高文本分类的精度,Schapire和Singer尝试了一个用Boosting来组合仅有一个划分的简单决策树(Stumps)的方法.其基学习器的划分是由某个特定词项是否在待分类文档中出现决定的.这样的基学习器明显太弱,造成最后组合成的Boosting分类器精度不够理想,而且需要的迭代次数很大,因而效率很低.针对这个问题,提出由文档中所有词项来决定基学习器划分以增强基学习器分类能力的方法.它把以VSM表示的文档与类代表向量之间的相似度和某特定阈值的大小关系作为基学习器划分的标准.同时,为提高算法的收敛速度

其他文献

重症监护病房COPD患者机械通气时间分析

目的探讨重症监护病房COPD患者机械通气时间的因素。方法选取重症监护病房进行机械通气治疗的54例COPD患者为研究对象,根据机械通气时间分为A组（≤7d组）18例、B组（8～14 d组）18例和

期刊

重症监护病房慢性阻塞性肺病机械通气时间相关因素intensive care unit chronic obstructive pulmonary di

一种用于光线与三角形网格求交运算的有效剔除算法

提出一种用于光线与三角形网格求交运算中的有效剔除算法.算法中,一根光线被定义为两个非平行平面的交线.针对由稠密三角形网格组成的复杂场景,算法通过三角形和测试平面的相

期刊

剔除测试三角形网格求交运算光线跟踪主光线rejection test triangle mesh intersection ray tracin

用Boosting方法组合增强Stumps进行文本分类

其他学术论文