论文部分内容阅读
随着互联网技术的迅猛发展,在线社交网络平台,如Facebook、新浪微博和腾讯微信等,变得越来越流行。在线社交网络平台为用户提供了一个更加方便、更加快捷和更加隐私的空间,这些特性使得在线社交网络平台逐渐成为了最大的信息传播平台。不同于传统的信息传播媒体,在线社交网络平台中的数据流更加庞大,且传输速度更快,传输范围更广,从而形成了非常多的网络舆情事件。这就要求一个健康的社交网络平台,能够对网络中的舆情进行有效的预测和防控,避免一些不良网络舆论的肆意散播引起社会动荡,从而造成一些危害社会治安的不良事件。网络嵌入(Network Embedding)是一项将网络当中的节点映射到低维向量空间中的技术,它在很多机器学习应用领域有着关键的作用,例如节点分类、社区发现和链接预测等。现今大部分的网络嵌入方法都是通过计算节点间的拓扑结构相似性来进行节点向低维向量空间的映射,而社交网络中节点的拓扑结构则主要描述了节点的社交关系。所以将网络嵌入方法应用到社交网络中进行研究时,会存在两个问题:首先,基于一个网络舆情事件构建的社交网络,网络中的社交关系非常稀疏,这样稀疏的网络结构严重影响网络嵌入的结果;第二个问题是这样的社交网络中,用户之间只存在社交联系,用户所拥有的观点信息将被忽略掉了,会使得网络嵌入结果不够准确。为了解决上述的问题,本文针对社交网络中的舆情事件,重新设计了一个观点网络嵌入模型——OFNE模型,OFNE模型主要从以下两个方面进行研究。(1)建立观点特征网络:针对社交网络中的某个舆情事件,首先建立一个社交关系网络,社交网络中的节点表示用户,而边则表示用户之间的社交关系。OFNE模型会分析网络中节点的文本信息,通过向量化技术,得到节点的观点特征向量,然后对比节点之间的观点特征向量,找出具有较高相似性节点对,用一条观点特征边来连接他们。这样就可以得到一个全新的三元组网络,本文将这个三元组网络定义为观点特征网络,由于引入了观点特征边,观点特征网络要比普通的社交网络联系更加密切,这样的网络进行嵌入的效果也会更好。(2)观点特征网络嵌入:在得到观点特征网络之后,以网络中节点的连接关系为依据,对网络进行嵌入操作。由于观点特征网络中拥有两种类型的边,所以OFNE模型设计了一个带权的目标函数来控制社交关系和观点特征的贡献比例,在不同类型的网络中,可以灵活的调配这个比例来达到更好的嵌入效果。OFNE模型引入了观点特征到社交网络中,将原本稀疏的社交网络变为了更加稠密的观点特征网络,并且在网络嵌入的过程中,同时考虑了社交关系和观点特征,从而取得了更好的嵌入效果。我们在多个真实网络数据集上进行了大量相关实验,实验结果都表明了OFNE模型在性能和效率上都有着不错的提升。