论文部分内容阅读
跨社交网络账号对齐是在线社交网络研究中重要的一部分,在信息检索、跨平台推荐系统、网络安全等领域的实际应用中具有至关重要的现实意义。由于社交网络用户属性缺失和网络结构提取不完整的问题,基于用户名的跨社交网络账号对齐算法受到了更多的关注。本文旨在仅聚焦于社交网络用户名,研究用户的命名习惯解决账号对齐问题,主要研究工作及创新如下:(1)针对现有基于用户名的账号对齐研究中简单分类算法容易受到正负实例训练不平衡影响的问题,本文提出了基于用户命名习惯映射学习的社交网络账号对齐算法。本算法通过BP神经网络实现两个社交网络用户名向量之间的映射,将分类问题转化为向量之间的映射问题,利用BP神经网络中误差反向传播的原理,反复调整权重,将所需要的映射函数学习训练得更加准确,最终计算两个向量之间的距离差确认是否这两个用户名属于同一个人,实现跨社交网络的账号对齐。在多个社交网络数据集上的实验结果表明,提出模型的precision@1值比基准方法中经典的算法UISN-UD提高了4%,并且在较小的训练集比例和训练次数进行实验比基准方法精度高、收敛快。(2)针对现有基于用户名的账号对齐研究中需要大量已标记数据进行有监督或者半监督训练的问题,本文提出了基于用户命名习惯对抗学习的社交网络账号对齐算法。由于已知对应关系的社交网络账号在数据获取方面存在一定难度,该算法引入弱监督训练的思想,仅利用较少的已标记训练数据,通过生成对抗网络中生成器和鉴别器博弈的机制,实现一个社交网络向量投影到另一个社交网络,通过最优传输距离来计算两个向量之间的分布差,从而判断这两个用户名是否属于同一个人,实现跨社交网络的账号对齐。在四个真实社交网络数据集上进行的实验表明,在多个社交网络数据集在训练集比例为5%的情况下precision@1比最好的基准方法结果提高了28%以上,在训练集比例为10%的情况下提高了16%以上,本算法可在较少标记数据的情况下保持对齐性能。