论文部分内容阅读
为提高管道状况异常检测的识别率和实时性,提出基于禁忌搜索的半监督K-means聚类和C4.5决策树的集成检测方法.在禁忌搜索中引入代价敏感函数,选择具有最佳分类性能的特征组合和最佳组合权值,提高了不平衡数据分布中少数类的识别率.半监督K-means方法首先把样本特征聚类为k类,再利用C4.5方法精确每一类的边界,级联式集成方法缓解不平衡数据分布问题,提高管道检测的准确度.并提出3种集成原则:加权叠加、最近一致和最邻近原则.实验结果验证了算法的有效性,在管道状况的异常检测中具有较高的分类准确度.