论文部分内容阅读
选择性集成技术既能提高泛化能力,又能节约存储空间,提高预测速度。从2003年选择性集成技术的提出至今,已经有了一些较为基础的研究成果和实际应用。本工作跟踪国际国内的研究前沿,针对有序分类问题进行了深入的探究和实验,取得的成果如下:(1)讨论了目前国际国内流行经典的选择性集成算法,在张春霞等人综述的基础上对选择性方法进行更为全面细致的研究,分析比较方法的优缺点与使用范围,探讨选择性集成未来可能的发展方向。并对常用的kappa差异性度量指标与泛化能力的关系进行理论上的分析与观察,为设计出更合理的选择性集成方法提供理论依据。(2)除名义属性(例如男,女)外,解释属性和响应属性还可能存在某种偏好序关系,即属性的取值存在序的意义,例如好,中,差。当解释属性和响应属性之间存在单调关系,解释属性序值高的实例必须分到序值高的响应属性中时,解决这类分类问题的方法称为有序分类,也称为单调性分类。决策树,神经网络,感知器等机器学习经典算法都被研究者用来有序分类,有序分类在客户评估,竞标决策,医药疗效等许多领域都有广泛应用。针对有序分类问题的集成算法也逐渐增多,但是并没有充分关注这类问题的选择性集成方法。本文针对有序分类的集成问题,提出一种基于加权kappa增益的选择性集成算法,在模拟实验和真实问题上该算法都取得了优异的效果。最后概括了本文的工作,并指出进一步亟待解决以及以后值得研究的方向。