基于UOS-ELM的不确定XML数据流分类的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:lan_lang_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络、数据库和IT技术的迅猛发展,在许多应用领域,比如互联网管理系统、实时传感器信号分析系统、电信系统和金融系统等,生成数据的速率越来越快,从而产生了一种海量、高速和动态的XML数据,称之为XML数据流。在实际应用过程中,网络传输不稳定、信息更新速度过慢、数据收集不完全等情况,会造成XML数据流存在不确定性。本文首先在分析不确定XML文档的不确定性的基础上,使用一种将不确定XML文档分成确定XML文档实例的方法,并依据能将动态的不确定XML数据流转化成静态不确定XML数据的滑动窗口技术,提出了一种基于极限学习机的不确定XML数据流分类算法US-ELM。US-ELM规定滑动窗口每次只滑动一个单位,并且每次滑动后都使用最新的数据重新训练极限学习机。然后分析了 US-ELM滑动策略和概念漂移检测上的不足,并提出了一种基于集成的不确定XML数据流分类算法EUS-ELM。EUS-ELM分类模型规定滑动窗口每次滑动的单位是滑动窗口的大小。在初始化阶段,EUS-ELM使用初始数据训练出多个分类器,并利用分类器不确定性等概念检测当前数据是否对于当前分类器发生概念漂移进而需要重新训练分类器。在测试阶段,EUS-ELM引入投票机制对分类结果进行处理。最后在充分分析了以上两种分类算法后,本文引入增量学习思想解决不确定XML数据流分类问题,提出了基于OS-ELM的不确定XML数据流分类算法UOS-ELM。本文实验表明,在滑动窗口的大小不断增长的情况下,EUS-ELM和UOS-ELM的分类性能高于UC-ELM。在训练时间上,当滑动窗口比较小时,US-ELM在训练时间方面要少于UC-ELM、UOS-ELM和EUS-ELM;当滑动窗口比较大时,UOS-ELM和EUS-ELM的训练时间要少于UC-ELM。EUS-ELM中分类器越多分类准确度越好,阈值越小分类性能越好;此外,UOS-ELM的分类性能会随着数据流的流动而逐渐提高。
其他文献
近几年来,数字图像在我们的生活和工作中扮演着越来越重要的角色。同时随着数字图像处理软件的发展,人们可以轻易地篡改数字图像而不留下明显的篡改痕迹。如果篡改图像被应用
大数据时代,数据的爆炸导致人类需要处理的信息越来越多。在计算机视觉领域,如何准确而又高效地从海量的图像中提取有用的信息越来越来越重要。在这样背景下,图像显著性检测
随着智能移动终端设备的迅速发展,智能手机,平板电脑等已经成为了人们生活中必不可少的一部分。移动互联网和移动应用在给我们的生活带来便利的同时也给服务器推送技术带来了
文本定位作为场景图像文本信息处理的重要模块,具有十分重要的实际应用价值和理论研究意义。经过最近十几年的发展,自然场景图像中文本定位技术取得了一定的进展;然而,由于场
随着社会的发展,基于位置的服务(Location-based Service)得到了广泛的应用,由此产生了各种复杂的空间文本数据,传统的数据库查询技术无法进行有效处理,因此如何提供各种高效
火焰、烟雾和焰火等自然界典型的不规则模糊景物,很难采用传统的建模方法进行模拟。粒子系统是迄今为止模拟和生成模糊景物最为成功的一种模型。焰火的品种繁多,色彩炫丽多变
人脸的检测与识别在诸如视频监控和人脸图像数据库管理等应用中发挥着关键作用。本文研究了人脸识别和检测技术,并为之开发了相应的算法。在人脸识别中,所使用的算法是主成分
随着信息技术的发展,信息技术已经成为支撑教育教学的主要手段,从教师备课、上课、到学生学习、再到学校管理,以及行政部门对学校的管理等等方面都已经离不开信息技术。围场
教育信息化背景下,在线学习平台得到了广泛利用,随之增长的还有学习者在线学习过程中所产生的数据,这些海量数据让学习者面临着“信息过载”和“信息迷航”的困境。如何在海
基于稀疏表示的分类算法在多种模式分类任务上都展现出了巨大的潜能,如人脸识别、动作识别、医学图像分类等,受到了国内外专家学者的广泛关注。本文主要针对三种不同的稀疏表