论文部分内容阅读
目前,复杂网络理论已经成为研究自然界和社会系统中很多问题的重要工具,被广泛应用于社会学、经济学、统计物理学、计算机科学和生物信息学等领域。随着社会和网络的飞速发展,人类的生活方式和社会关系已经发生了巨大的转变。这促进了一种新型社会网络——在线社会网络的出现与发展。在线社会网络是一个典型的复杂网络,应用复杂网络理论分析其网络性质,研究用户在网络中的关系和行为对认识在线社会网络的拓扑结构和演化规律、处理网络海量信息等方面具有重要的理论意义和应用价值。 本文利用多子网复合复杂网络模型,研究了多关系在线社会网络拓扑结构及演化规律,并对多关系在线社会网络的社团发现问题进行了研究,在此基础上提出了一种基于多种关系的在线社会网络推荐算法。本研究促进了复杂网络与数据挖掘领域的结合,为基于复杂网络的多关系在线社会网络推荐系统的研究提供了理论支撑。论文的主要研究工作如下: 对多关系在线社会网络进行了实证研究。以具有代表性的多关系在线社会网络——豆瓣网为研究对象,通过自主开发的网络拓扑测量软件,获取豆瓣网中11万多用户间的关注关系和书评相似关系的实测数据,从网络特性分析的角度展开研究,分别对由这两种关系构建的用户网络的拓扑结构进行基本特征量的分析。在此基础上,利用多子网复合复杂网络模型理论,对豆瓣网用户多关系复合网络拓扑结构进行基本特征量的分析。基于上述分析,得到了对豆瓣网用户多关系复合网络拓扑结构及其演化规律的准确认识,为后续多关系在线社会复合网络演化模型的提出奠定理论基础。 利用多子网复合复杂网络模型,提出了一种多关系在线社会复合网络演化模型。基于实证得到的豆瓣网用户关注关系网络和豆瓣网用户书评相似关系网络拓扑结构的网络特征和演化规律,利用多子网复合复杂网络模型理论,将用户关注关系子网和用户书评相似关系子网进行复合,提出了一种基于多子网复合复杂网络模型的多关系在线社会复合网络拓扑演化模型,该模型综合考虑多种关系之间的相互影响以及在线社会网络中的局域世界网络特性。通过大量仿真实验结果与同等规模实际网络的网络特征的对比,表明该模型能够较好的模拟多关系在线社会网络拓扑结构的基本特征。 利用多子网复合复杂网络模型,对多关系在线社会网络聚类方法及社团结构进行了研究。在对已有的复杂网络社团结构发现算法深入研究的基础上,将数据挖掘中聚类分析方法应用到多关系复杂网络的社团结构发现算法的研究中。基于多子网复合复杂网络模型,提出了多子网复合复杂网络中的多种关系的信号传播机制,实现了多关系复合网络的节点集合向适合聚类分析的特征向量空间的转换。在此基础上,提出了多子网复合复杂网络中新的节点相似性度量方法——节点相似性系数。基于上述两个创新点,提出了一种结合模块度的基于层次聚类的多子网复合复杂网络的社团发现算法,利用该算法得到的社团结构划分结果由层次树得出,划分结果层次清晰。实验结果显示,利用该算法得到的多关系在线社会网络社团结构发现结果准确率较高。 对多关系在线社会网络中的推荐系统进行研究。推荐系统是一个典型的数据挖掘应用问题。基于本文上述研究成果,提出了一种基于多种关系的在线社会网络推荐算法。该算法利用多子网复合复杂网络模型结合多关系在线社会复合网络演化模型得到推荐系统的用户模型,在该模型的基础上,提出了基于多关系在线社会网络社团结构的最近邻查询方法,并在找出的最近邻居集合以及最近邻所选的项目集合及相应评分的基础上做出推荐。实验结果显示,本推荐算法的召回率、准确率等推荐系统评价标准比传统的协同过滤推荐算法要高,具有较为准确的预测结果。