基于集成学习的半监督学习算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:caep315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在模式识别领域,有很多问题需要获取大量的有标记数据以训练出高精度的分类器,但有标记数据的获取却是非常困难的,甚至要消耗大量的人力物力。随着数据收集和存储技术的飞速发展,未标记数据的获取变得相对容易。因此如何挖掘未标记数据携带的信息,辅助少量的有标记数据进行半监督学习,成为近年来国内外研究的一个热点问题。在现有半监督学习算法的基础上,如何更好的结合集成学习技术,训练多个分类器互相协作进行半监督学习,是一个值得深入研究的方向。本文在该方向上进行了研究,取得的主要成果有:(1)提出了一种半监督学习算法—Vote-Training。在UCI数据集上的大量实验表明,Vote-Training算法可以有效地利用未标记样本训练出识别率更高的分类器,与已有的半监督学习算法—Tri-Training相比,该算法耗费的时间较少,结构更为灵活,可以针对不同的问题调整投票策略,选取最合适的方式来解决具体的问题。在实验中,还对实验数据做了进一步的分析,指出了Vote-Training算法有效的前提条件。(2)分析了传统的协同训练算法存在的不足之处,通过加入更多的分类器和引入主动学习技术,提出了改进的协同训练算法—CTA,在UCI数据集上的实验验证了该算法的优越性。半监督学习算法存在着选择优越性的问题,没有一种算法能够解决所有的半监督学习问题。深入分析现有的算法,运用相关原理和技术,探寻一个统一的原则来指导具体的半监督学习问题是一个很有意义的研究方向,本论文即是对此的一个有益尝试。
其他文献
学位
随着3D扫描设备的日益成熟和CPU计算能力的提高,3D人脸分析与识别算法得到了长足的发展。3D人脸识别不仅具有人脸识别友好,不易伪造等优点,还不像2D人脸识别那样易受光照,姿
学位
当今网络的安全性和健壮性日益重要,攻击网络主机的病毒也转为以消耗系统资源来干扰网络正常运行,因此,必须对网络实时监控,检测并分析网络异常行为,尽早发现问题以减少损失
一种新型的基于Web2.0的数据集成应用程序正在Internet上逐渐兴起。通常用术语Mashup(糅合)表示,它的流行萌芽于对交互式用户参与和集成第三方数据。MashupWeb站点的特点就表现
随着多媒体技术的飞速发展和计算机网络技术的成熟,信息隐藏技术已经成为了实施隐秘通信的重要方法,为越来越多的人所接受。根据载体的不同,信息隐藏技术可以分为图像、视频、软
高频脑电是指频率在36-44Hz的阵发性脑电,高频脑电携带有丰富的思维活动信息,是大脑的功能及状态的反映。通过对高频脑电的研究来反映出注意、抽象和形象思维等精神活动的机
在基于包机制的网络上传输信息时,数据被封装成一个一个的包,从源主机通过网络传输到目的主机。当网络发生拥挤堵塞或者是服务器的缓冲区发生溢出时,就会导致数据包的延迟或
随着网络技术和多媒体技术的迅速发展,图像数据的安全有效传输越来越受到人们关注,数字图像压缩和加密技术应运而生。本文主要对基于小波变换的图像压缩编码算法和以混沌理论为
随着计算机技术和数据库技术的快速发展,人们采集数据的能力有了很大的提高,并积累了大量的数据。通常仅仅对这些数据做简单的查询、编辑工作,然而这些数据中隐含了大量对人