面向中文微博的社区发现和结构洞挖掘的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhangyi89521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,虚拟社会网络逐渐成为了人们关注的焦点。人们可以在虚拟社会平台中更加方便地认识好友和相互交流,从而促进了真实社会关系的发展,使得人类的活动与互联网的应用融为一体。而微博作为一种新兴的网络信息交互平台,其优越独特的设计理念使得用户之间的交流更加及时、方便与畅通,庞大的用户群体以及海量的文本信息蕴含着极大的价值,在不同的研究领域有着重大的意义。本文对微博网络中的社区发现和结构洞挖掘的主要研究如下:首先,阐述了社会网络的基本概念及主要特征,对网络分析的相关理论和技术进行分析,即文本的预处理、文本的表示模型以及常用的聚类算法等,同时,对文本的语义分析理论进行研究,了解特征空间降维的必要性以及隐含语义分析的基本流程。其次,分析微博网络的主要特点及其交流机制,并采用微博开放平台实现了数据的获取。同时,微博网络呈现出多维度的结构特征,而传统平面结构的网络模型不能体现不同主题领域下的权威度,因此,提出了基于主题的多层次网络模型,从不同的层次建立不同主题的用户交互网络图,以充分挖掘出网络中的社会群体。再次,分析微博网络的社区特征,并在传统的社区发现算法基础上,考虑到社区的主题特性,采用了词共现度的事件划分以及隐含语义的进展分析,实现基于主题相似性的社区发现。同时,从社区的网络结构出发,提出了基于最大基数搜索的Greedy算法以及基于权重平衡的WEBA算法,实现了网络社区结构的合理划分。最后,阐述社会网络结构洞节点的基本概念,以及其在社会资产以及不同领域中的重要作用,通过PageRank算法对网络节点的重要度做出了重要评价。并在此基础上,从网络的社区结构和流网络的信息扩散角度出发,提出基于舆论领袖的HIS算法和基于最小割集的MaxD算法,实现了结构洞节点的挖掘。
其他文献
随着计算机技术和网络技术的广泛应用,信息系统在规模、结构、功能层次及设计实现等各个方面均发生了很大的变化。在不同的硬件环境、操作系统以及通讯平台上开发具有正确性
随着互联网的迅速发展,网络已成为无处不在,无所不用的工具。然而,伴随而来的网络安全问题也成为全球瞩目的焦点。近些年来,对网络信息系统进行攻击的事件越来越频繁,每年以几何级
数据挖掘在最近几年里己被数据库界广泛研究和应用,而关联规则的挖掘在其中占有很重要的地位,其在商务决策制定方面的应用很有前景,而生成频繁项集是关联规则挖掘处理中的瓶颈,因
随着多媒体技术的发展,信息的数字化领域越来越大,其中很多信息都被转化成数字影像。由于数字影像占用空间大,更新快,对它的管理已成为一些部门急需解决的问题。本文提出一种
高精度计算、图形加速、数字信号处理等应用对浮点处理的要求越来越高,浮点运算单元(FPU)成为当代微处理器中一个重要组成部分。由于集成电路技术的发展,芯片的集成密度大大
随着计算机技术的不断发展,现代企业面临的环境越来越复杂。由于企业信息系统大多数为多平台、多系统的复杂系统。这就要求企业解决方案具有广泛的兼容性能,可以支持不同的系
面向对象的软件开发技术是当今软件开发的主流技术,但是,在利用面向对象技术开发软件的过程中,一直存在着对象关系映射这一经典问题。在应用系统开发中,对象与关系的映射是一
近年来,无线网络进入高速发展时期。Wi-Fi热点在全世界范围内的大量部属,移动设备性能的快速提高和成本的不断下降以及世界范围内迅速增长的移动用户群使得内容、服务提供商
聚类分析技术作为一种数据处理手段近些年来一直是人们的研究热点,其在模式识别、数据挖掘、图像处理等领域内有着广泛的应用。聚类算法主要分为基于划分的聚类算法和基于层次
随着企业竞争的日益激烈,受企业外部环境影响,业务规则越来越趋向多样性和多变性。业务规则的多样性和多变性决定了企业工作流的多样性与多变性。面向对象技术的出现使得人们可