论文部分内容阅读
针对Web信息过滤问题,提出一种将粗糙集理论和决策树SVM(DTSVM)相结合进行数据分类、过滤的新方法。该方法运用改进的启发式相对属性约简算法消除冗余、降低样本空间维数,通过聚类和DYSVM相结合来训练SVM,将多分类问题转化为二值分类问题,提高了训练速度及过滤精度。实验表明,该算法得到了较高的查全率、查准率,体现了将粗糙集理论与DYSVM算法结合的优越性。