基于谱聚类的网络社会划分技术研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:wellstudyc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实世界中,网络随处可见。如全球交通网络、因特网、生物系统中的新陈代谢网络、科学家合作网络、生态网络和在线社区网络等。网络中存在着大量的社区结构,而对网络进行社区划分能够很好的理解网络,它不仅帮助人们能够了解该网络的结构,而且还帮助人们发现该网络的特性。社区划分技术广泛应用在物理学、生物学、计算机图形学和社会学等领域中。其研究成果不仅可以为用户提供一些及时、可靠并且有价值的信息。而且在理论与实际生活中都有极其重大的意义。   近年来,谱聚类算法在机器学习领域中获得了广泛的应用。与传统的聚类方法相比,它具有能在任意形状的样本空间上进行聚类,以及能收敛到全局最优解的优点。但是传统的谱聚类算法对尺度参数十分敏感,如何选择一个合适的尺度参数十分困难。因此本论文改进了传统的谱聚类算法并进行了相关扩展。本论文主要工作包括:   (1)针对传统的谱聚类算法选择尺度参数的问题,本论文提出了一种改进的自适应谱聚类算法,该算法通过融合核学习理论中的核参数选取技术,并采用核参数选取方法中的迭代组合思路选择尺度参数,使得改进后的自适应谱聚类算法能够自适应的选择最优尺度参数组合;   (2)针对自适应谱聚类算法未能利用网络数据集样本间监督信息的问题,本论文提出了一种改进的半监督自适应谱聚类算法,在自适应谱聚类算法的基础上融合了半监督聚类学习理论,并通过成对约束集构建相似矩阵,使得改进后的半监督自适应谱聚类算法能够有效利用网络数据集样本间的监督信息;   (3)针对半监督自适应谱聚类算法未能有效充分利用网络数据集间监督信息的问题,本论文提出了一种改进的半监督谱聚类集成算法,在半监督自适应谱聚类算法的基础上融合了聚类集成理论,并通过集成成对约束集,使得改进后的半监督谱聚类集成算法能够进一步有效利用网络数据集间的监督信息。   本文针对上述三种改进的算法,分别通过人工网络数据集和现实网络数据集分别进行了实验验证,通过实验表明了改进算法的有效性。
其他文献
支持向量机是由Vapnik等人基于统计学习理论提出的一种新型的机器学习方法。支持向量机基于结构风险最小化原理,综合考虑了经验风险和置信风险,具有良好的泛化能力和较高的分
随着互联网的迅速发展,网络上的信息成爆炸式增长。自从Tim Berners-Lee提出Web2.0的概念之后,用户从被动的接受信息逐渐转变成信息发布的参与者。社会标签是Web2.0的众多应用
随着计算机网络技术的发展,为了满足视频点播、网络会议、网络实时游戏等多媒体应用这些当今因特网的主流业务,急需建立一种高效的、有QoS保障的数据通信机制。建立这种机制主
近年来,不确定数据的管理吸引了来自工业界和学术界的极大关注,特别在诸如无线传感器网络、生物技术和生物数据库、基于位置的服务和数据流等新兴的领域中。为了准确获取不确定
数据挖掘是指从分散的异构信息中获取知识的过程,其直接目的是快速检索有用信息,将数据挖掘与Web结合形成的Web信息挖掘是处理海量Web信息的有效手段。虽然Web信息挖掘能极大
时空数据库技术是计算机科学的新兴领域。由于时空数据库本身的一些特性,所以被广泛应用到多种领域。本文重点比较了适用于网络中移动对象轨迹查询的索引结构,提出了一种适用于
当今计算机技术的发展日新月异,软件在我们的生活中扮演着水和电的重要角色。C语言作为一门广泛应用的语言,已有40多年的历史,它在系统软件如操作系统、编译器、数据库等领域
联机事务处理是数据库领域的重要应用。随着近年来电子商务的迅猛发展和企业数据量的激增,用户对数据库事务处理能力提出了越来越高的要求,而处理器技术和内存技术的发展也为
随着网络普及和技术的发展,人们的日常生活中对互联网的依赖性越来越高。普通公众更多地选择通过网上交易实现购物,而政府机构也大力倡导电子政务和电子贸易。当大量用户使用网
最小生成树问题是一类经典的网络优化问题。大量研究表明,最小生成树结构是通信网络设计的最优拓扑。生成树在大多数网络设计和分析问题中扮演着重要角色,然而,实际的网络优化问