基于OCSVM的分布式聚类技术研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:fang19902009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展以及数据的不断积累,如何从现有的历史数据中发掘对用户未来决策有指导性的信息是计算机科学技术面临的挑战性任务之一。聚类分析技术通过根据数据的相似性划分为不同的类别,从而完成对未知数据的类别划分,并被广泛的应用于机器学习、数据挖掘、信息检索、图像处理等多个领域。   如何在有效的时间内完成对海量数据的处理并给出合理的分析结果是聚类分析面临的主要问题之一,针对这一问题本文提出了一种基于OCSVM的分布式学习系统框架,使得学习过程能最大程度的整合现有的计算资源,从而提高了学习效率。   本文研究了基于OCSVM聚类算法的分布式计算策略,利用分治的策略将数据集分配给多个Agent,通过多个Agent的协作来完成聚类任务,然后对各个Agent的聚类结果进行汇总得到与串行算法一致的聚类结果。另外,在单类支持向量机的理论基础上,本文对所提出聚类算法中涉及的两个参数的设置规律以及聚类数目确定的方法进行了研究。   最后,通过对实验结果的对比以及分析,证明了分布式框架的有效性以及分布式聚类算法的正确性。
其他文献
随着教学改革的不断深入,各高校充分利用先进的信息技术手段来提高教学管理水平,教学管理信息系统的建设不断完善。但通过对当前各高校教学教务管理系统的调查发现,大多数高校的
在P2P系统中,节点既是消费者也是服务者,它们能随意地加入和离开系统,并能匿名地进行直接交互。因此,基于P2P环境下的电子商务正作为一种新兴的电子商务模式迅速地发展起来。
随着信息全球化和分布式网络技术的飞速发展,为有效解决企事业单位内部资源的共享问题,采用信息系统集成技术对应用服务进行统一管理已经成为一种发展趋势。 具有松散耦合性
Internet作为上世纪70年代的产物,其主要是以面向文本数据传输为背景提出来的,随着多媒体网络应用变得丰富,Internet传统的“尽其所能”的服务模式已经难以满足新数据流对服
人脸识别和虹膜识别作为两种最常用和方便的生物特征识别技术,已广泛应用于身份识别等领域。然而很多时候,仅仅基于虹膜或人脸的个人身份自动识别系统不能满足人们的需要,这是因
油藏数值模拟始于20世纪50年代,是随油藏工程渗流理论、计算数学理论电子、计算机技术的发展而形成的一门新兴学科。油藏数值模拟通过分析油藏内的流体状况,预测油藏的未来动
这些年来,由于国内经济的飞速发展,汽车的数量越来越多,而道路容量不能满足现在的需求,交通事故和交通堵塞时时刻刻在发生,城市的交通压力越来越大。在这种形势下,由于无法避
虚拟驾驶系统是数字媒体领域的热点应用之一,它覆盖了计算机图形学、3D渲染、物理仿真等多个领域的方法和技术,在数字娱乐、交通仿真、汽车工业研发、国防建设等领域有着广泛的
随着计算机技术特别是Internet技术的迅猛发展,各个行业、单位、机构或部门内部都逐步实现了业务、信息的计算机管理。在企业内部,由于部门间相对独立,构建系统时缺乏统一的规划
随着计算机技术的发展,动画在电影、游戏中所占比重越来越高,因此合理的动画生成算法既要满足一定的质量要求,而且需要满足一定的速度要求。在质量和速度的平衡中找到新的算