委员会机器的研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:fencer_2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络的研究自从上世纪80年代起引起了人们的高度重视,其应用范围广泛,涉及模式识别、函数逼近、智能控制、数据挖掘和知识发现等诸多领域,取得了可喜的成绩。但在应用中,尤其在神经网络学习方面还面临着一系列的问题,比如如何确定网络结构、过学习与欠学习、知识增量学习等。这些问题严重影响着神经网络的整体性能。如何解决神经网络面临的问题,建立有效的神经网络学习机制是神经网络应用迫切需要解决的课题。 基于微分几何、信息论、统计学的信息几何理论,以及将自然界中的进化过程引入工程研究领域以解决工程中优化问题的进化计算理论是研究非结构化、非线性空间更合理的方法和手段。以应用这些理论为代表的整体结构的研究是人工神经网络发展的重要方向和突破点之一。 本文主要以信息几何理论和进化计算理论为基础,对神经网络学习中的几个关键问题如模型选择、学习准则及增量学习问题做了研究,提出了基于广义KL距离和几何曲率的模型选择准则;给出了一个一般意义上的后验委员会机器体系结构及对应的学习准则;提出了具有增量学习能力和对个体进行优化选择的混合委员会机器构造算法;最后利用进化计算、Boosting算法和负相关学习来构造委员会机器的优化算法。 主要创新工作有: 1、提出了一种基于流形上的广义KL距离和几何曲率的模型选择准则KLCIC,并给出了理论分析与实验验证。该准则利用模型流形的内在几何特性及模型流形与数据流形的几何位置关系来评价模型的拟合度,而用模型的几何曲率来衡量模型的固有复杂度,它们具有参数表示不变性的特点,赋予了复杂度与拟合度清晰的几何意义,为基于数据的模型选择提供了理论上的支持,实验结果也证实了准则的可行性与有效性。 2、分析委员会机器学习准则的选择与逼近、自适应性和竞争性的紧密关系,通过最小化后验分布间的KL距离,给出了一个一般意义上的后验委员会机器体系结构及对应的学习准则。实验结果证明了方法的可行性与有效性。 3、在深入分析Learn++的基础上,尽可能地在不使用原有数据样本的情况下,通过嵌入自生长的动态委员会机器改进了Polikar提出的以静态委员会机器结构为基础的Learn++算法,提出了具有增量学习能力、对个体进行优化选择的混合委员会机器构造算法Learn++.H。实验结果证明了方法的可行性与有效性。 4、提出了利用进化计算、Boosting算法和负相关学习算法来构造委员会机器的NEB算法。该算法给个体网络间提供了两次交互协作的机会,使得在同一过程中完成个体网络的学习和整合。
其他文献
未来对计算速度、系统可靠性和成本实效性的要求必将促使发展另外的计算机模型来取代传统的冯·诺依曼型结构的计算机。随着计算机网络的出现,一个新的梦想成为可能——分布
计算机网络的迅速发展给人们工作和生活带来了巨大便利,同时也对网络管理提出了更高要求。随着网络规模的扩大,网络的管理和维护越来越困难。如何保证网络运行的安全性,是各机构
编译器是一种将高级程序设计语言编写的源程序转化为语义等价的机器语言程序的系统软件。在这个过程中,编译器常常会对于输入代码进行优化,从而可以得到更好的性能或者是减少
应用层多播将多播功能迁移到应用层,避免了多播应用对网络基础设施的依赖,易于大规模的部署和实施,其灵活性和可扩展性是IP多播所不可比拟的。同时网络层功能的上移为实现高
随着云计算、面向服务的体系结构以及软件即服务的流行和发展,Web软件系统的使用越来越普遍。这类系统往往运行在复杂、多变的网络环境中,面临着大量的不确定性,因此其运行时质
移动Agent是一种新型的分布式计算技术,具有良好的应用前景。作为一种能够在异构网络中自主迁移的分布式计算实体,移动Agent具有减轻网络负载、支持断连操作、动态适应网络等优
随着我国农业信息化的发展,农业相关信息也呈现出了信息资源海量化的特征,如何才能在信息的海洋中获取到适时、准确、有价值的信息是农业信息化亟待解决的问题。把各种信息进行
随着信息技术的进一步发展,计算机越来越多应用于企业计算和多媒体教学等领域。目前这些应用大多仍采用以传统内置磁盘计算机为主体的分散计算模式,这种模式虽然在一定程度上
在计算机科学中多年的研究与实践后,我们发现依据稳定性的传统定义是很难使得计算机系统获得稳定性的,因为单一的一个计算机系统显然是不可能对在其中运行的所有进程都保持稳定
虚拟专用网(VPN)是一种应用广泛的网络服务方式,随着互联网技术和无线网络技术的迅速发展,远程访问VPN技术在网络应用中扮演着越来越重要的角色。VPN技术为企业用户带来了更