【摘 要】
:
在线社交网络是一种允许人们建立社会联系、参与互动交流、分享心得体会的在线平台。随着互联网信息技术的蓬勃发展,在线社交网络以其通讯即时、使用便捷、信息多元、用户海量等特点,深受广大用户的青睐与好评。人们将日常社交行为从线下生活延伸至线上网络,使得在线社交网络成为人们日常生活中不可或缺的重要平台。用户作为在线社交网络中的信息产生者与消费者,是各类在线社交平台的核心资产,其社交特征是识别用户身份、描述用
论文部分内容阅读
在线社交网络是一种允许人们建立社会联系、参与互动交流、分享心得体会的在线平台。随着互联网信息技术的蓬勃发展,在线社交网络以其通讯即时、使用便捷、信息多元、用户海量等特点,深受广大用户的青睐与好评。人们将日常社交行为从线下生活延伸至线上网络,使得在线社交网络成为人们日常生活中不可或缺的重要平台。用户作为在线社交网络中的信息产生者与消费者,是各类在线社交平台的核心资产,其社交特征是识别用户身份、描述用户特点、刻画用户画像、理解用户意图的重要信息。各类在线社交网络服务以用户为出发点,深入分析用户社交特征信息,挖掘受众用户身份、用户群体构成、用户立场倾向等内容,提供商业智能分析、政情民意分析、个性化推荐服务、实时医疗分析等多种不同功能。因此,用户社交特征分析具有重要的现实意义和广泛的应用价值。然而,用户社交特征分析存在着诸多困难。一方面,在线社交网络用户规模海量庞大,呈千万级乃至亿级,而用户属性信息类别多样、内容多元。用户与属性规模的上升会使得输出空间呈指数级增长,在准确性与时效性上大幅增加用户属性预测难度。另一方面,在线社交网络用户间关系结构复杂、异构多元,而用户间关系语义信息呈隐性特征,信息内容稀缺。如何有效利用低质量训练数据开展社交关系特征分析成为一项具有挑战性的工作。面临这些现实挑战,本文从用户属性信息和用户关系信息两个维度出发,分别从用户显性属性信息、用户隐性属性信息、用户间隐性社交关系和用户间关系类型四个角度研究用户属性信息挖掘、用户兴趣点推测、用户间隐性社交关系发现和用户间关系类型识别四项内容。(1)在用户属性信息挖掘方面,针对用户属性信息内容缺失、格式不一、虚假难辨等问题,提出一种基于社交关系与用户言论的用户属性推测框架,从社交关系和用户言论两个层面刻画其对于属性可能的影响。在社交关系层面,本文提出了一种基于社交关系的属性置信传播算法SocialInfer。根据现实社会中具有社交关系的用户拥有相似社会属性这一现象,算法将用户及其关系映射为网络图结构,运用图上置信传播推断用户的属性信息。在用户言论层面,本文提出了一种基于用户言论内容的UCBert模型。通过结合不同用户群体在语言环境、用语特点及用语习惯等方面呈现出的特点,模型采用双向Transformer模型对用户个人属性进行推断。通过综合用户间社交关系和用户言论两种不同因素对用户不同属性的影响,本框架计算用户对于任意属性的属性分布,挖掘可能性最高的用户属性。实验结果在Facebook、Twitter、Instagram等数据集下测试验证,发现本文提出方法具有较高的属性挖掘准确率。(2)在用户兴趣点推测方面,针对用户兴趣点挖掘中用户-兴趣矩阵稀疏、上下文信息混杂的现实挑战,提出一种混合式用户兴趣点推荐框架,分别从用户偏好、好友重要性和兴趣点位置相关性三种因素考虑对于用户兴趣点推荐的影响。在用户偏好层面,模型运用协同过滤计算每名用户签到轨迹的相似性。在好友重要性评估层面,模型构建了一种用户-兴趣点社交网络图,运用书签着色算法计算用户对于兴趣点的关联性。在兴趣点位置关联层面,通过假设用户兴趣点之间的距离分布,根据兴趣点距离估计用户可能感兴趣的兴趣点。最终,通过汇总三种因素下用户对于兴趣点的预测得分,推断用户可能感兴趣的兴趣点。本文最终在真实数据集上进行实验测试,能够在精确率和召回率上具有更优的性能。(3)在用户间隐性社交关系发现方面,针对在线社交网络中网络结构不完整、节点信息不完全、用户间隐性社交关系难发现的现实问题,提出一种基于扩展社交图的用户间隐性社交关系发现模型。该模型通过融合隐藏用户部分可知的少量可见社交关系、用户属性信息和用户言论信息,构建一种扩展社交图,丰富隐藏用户的表征信息。通过运用卷积神经网络对扩展社交图上不同类型关系进行卷积,获取节点的最终嵌入表示,进而推断节点间可能的隐性社交关系。实验结果表明,本文提出模型在各类不同数据集上表现出优异的性能,说明本文研究成果对于用户间隐性社交关系发现有着更显著的发现能力。(4)在用户间关系类型识别方面,针对在线社交网络用户间社交关系异构互联、识别困难这一问题,提出一种基于图注意力机制的关系类型识别模型。通过分析网络结构中的割边,运用图注意力机制对割边与非割边两种不同类型边进行学习。结构平衡理论与状态理论等社会学理论指出,特定三元组内的关系结构是平衡状态的,从社会学意义上给出了关系类型识别的依据。通过区分不同类型边所构成的三元组结构,分别运用图注意力机制学习其网络结构特征。最终,通过构建合适的目标函数,获得最终的节点嵌入表示,进而对边类型进行判断。多数据集的测试结果表明本方法具有更高的准确率。
其他文献
文本问答,旨在构建能够回答任意自然语言问题的计算机系统,是自然语言处理与人工智能领域内最具难度的挑战之一。阅读理解式问答,又称机器阅读理解,是文本问答的一个子任务,在近年来受到学术界和产业界的极大关注。机器阅读理解的目标是教会机器阅读并理解人类语言文本并回答相应问题。由于该任务天然地可以被用来衡量机器自然语言理解能力,因此具有重大的研究价值。此外,阅读理解技术还能被广泛应用于问答应用、搜索引擎以及
云计算技术的发展和普及,在给人们的生产生活带来便利的同时,也使得越来越多人担心云环境下的数据安全和隐私问题。一方面,云平台收集或者用户外包的数据中可能包含敏感数据,直接将数据交给云平台,可能会造成用户隐私泄露。另一方面,云平台自身的安全防护措施并不够完善,导致外部攻击和内部泄露时有发生。传统的随机扰动、数据匿名等技术,虽然能够一定程度上保护数据,但安全性有限,常常导致数据挖掘结果精度下降。一般加密
网络空间安全日益上升为一种国家层面的战略问题,各国都高度关注本国以及与之紧密关联国家的网络安全。我国正致力于实现网络强国的发展目标,营造创新、协调、绿色、开放、共享的网络环境,这也是当前网络空间安全领域研究的热点。作为文件、信息和资源等联网内容的共享平台,内容共享网络在互联网中具有十分广泛的分布。随着网络技术的快速发展和深入应用,特别是对等网络(P2P,Peer-to-Peer)的兴起与流行,极大
随着计算机和网络技术的不断发展,人们对通信数据安全和隐私的重视程度也与日俱增。在此背景下,TLS(Transport Layer Security)协议得到广泛应用。TLS在端到端会话中的实体认证、流量机密性和完整性等方面起到重要作用。同时,计算机网络中还有很多不同功能的网络中间设备,如入侵检测设备、家长过滤系统等,对于维护网络安全、实现网络功能和提高网络性能具有不可替代的作用。TLS加密网络流量
由于合成孔径雷达(Synthetic Aperture Radar,SAR)具有全天时、全天候对海洋环境监视能力,开展基于SAR图像的舰船目标检测技术研究对经济民生和国防事业都具有十分重要的意义。从SAR技术诞生至今,国内外学者和研究机构针对SAR图像舰船目标检测技术开展了大量的研究,取得了一系列重要成果。然而,针对SAR图像中目标轮廓模糊的情况,传统方法依然难以取得好的检测结果。此外,随着SAR
随着我国城镇化的快速发展,公共场所人群失稳事故频发。大数据时代,行人运动及人群疏散数据的获取空前便利,如何利用这些数据增强建模仿真技术在公共场所人群应急管理全过程的效能面临巨大机遇和挑战。为应对这些机遇和挑战,本文提出使用数据驱动的方式对行人运动及人群疏散建模仿真进行研究。首先建立了基于平行仿真的行人运动及人群疏散建模仿真应用框架,其中数据驱动的仿真建模是实现该框架的的关键技术。然后从模型结构空间
基于红外成像的空间目标识别是导弹防御系统中的关键环节。远距离空间目标的红外成像为点目标,仅能获取目标辐射强度序列。如何从中提取目标的形状和姿态运动等特征信息,进行有效的点目标识别是研究的重点和难点问题。在智能化作战需求的牵引下,本课题基于空间点目标的红外辐射强度时间序列,开展了神经网络空间目标识别技术的研究,主要研究内容包括以下三个方面:第一,空间目标红外辐射强度建模及形状与姿态反演。对目标表面温
空间机器人一直是在轨服务技术中的重要选项之一。随着服务对象的不断扩展,加之航天任务对可靠性的极高要求,单臂乃至多臂空间机器人将面临一些难以胜任的操作任务。而小卫星的应用和编队技术的成熟,使得多空间机器人协同服务成为可能。本文以多空间机器人编队组成的在轨服务系统为研究对象,以李群李代数和旋量理论为基本工具,在建立系统运动学和动力学模型的基础上,重点研究了运动规划和跟踪控制问题。所得主要成果如下:1、
雷达辐射源分选与识别一直是电子侦察监视、电子对抗等领域的热点研究问题。随着各类辐射源和有意无意干扰的增多,并伴随着雷达低截获概率技术的发展、工作体制的复杂化以及抗干扰技术的综合应用等,导致截获信号呈现出信噪比低、干扰脉冲多、观测误差大等特点,雷达脉冲序列规律性被严重破坏,使得模型驱动类的传统分选与识别方法面临严重挑战。机器学习是由数据驱动的信号处理与信息获取工具,近年来在图像处理、数据挖掘、自然语
阵列信号处理是现代信号处理领域的重要分支,在移动通信、雷达、声呐、射电天文、电子医学等领域具有重要的应用。目前,经典的阵列测向方法属于模型驱动类方法,如MUSIC、ESPRIT及其各种改进算法。然而,模型驱动类方法在实际工程应用中始终面临着阵列误差、低信噪比等复杂环境的严峻挑战。机器学习是由数据驱动的信号处理与信息获取工具,在数据挖掘、文本理解、图像处理、模式识别(人脸、语音)等领域受到了广泛的关