论文部分内容阅读
针对几种朴素贝叶斯训练集优化算法的缺点,结合贝叶斯分类器的增量学习特性,提出了一种朴素贝叶斯训练集增量优化算法。该算法将原始训练集分成两个部分,首先以第一部分为基础,增量获取另一部分的较优子集,再以该子集为基础,增量获取第一部分的较优子集,这个过程交替迭代,最后得到原始训练集的最优子集。该方法不需要设定阈值,自动收敛,优化过程充分利用了样本信息。实验表明:用最优子集训练新的分类器,可以有效提高分类精度。