论文部分内容阅读
特征降维是文本分类中的重要环节.在对常用的特征选择方法分析研究的基础上,提出一种将评估函数和Boosting算法相结合的特征选择方法,该算法采用基于Boosting算法的汉明损失作为最终特征子集的评估准则,进一步寻找具有关键作用的特征项,进而形成最终用于分类的特征子集.数据集上的实验结果表明,该方法有效地改善了分类性能.