论文部分内容阅读
本文提出了一种新的文本特征降维方法。对于经过预处理后的具有较多数量特征词条的文档集,首先采用模式聚合理论将对分类类別有相似贡献的特征词条合并为新的特征,从而减少了特征的数量,然后利用粗糙集的决策表表示,用属性约简理论进行特征再降维,最终得到可以有效表示文档的特征集。利用公用标准数据集Reuters21578进行仿真实验,结果表明此降维方法是有效的。