基于异构信息网络的虚假评论群组检测

来源 :燕山大学 | 被引量 : 0次 | 上传用户:XFJ1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展,电子商务也随之兴起,商品的评论成为了人们进行购买决策时重要的参考信息。为了获得可观的收益,商家通常雇佣多个虚假评论发布人对其竞争对手的产品进行恶意评论来诋毁产品的质量或者对自身的产品进行良好的评论来增加产品销售量。这些被雇佣一起进行不实评论的团体叫做虚假评论群组。对比于单个虚假评论人,虚假评论群组更隐蔽,对电商平台产生的威胁更大,严重影响了电商平台的公平性。为检测虚假评论群组,人们提出了各种检测方法。然而,这些方法存在着不能充分利用已有的信息和检测精度不高的问题。为解决上述问题,本课题从以下两方面进行研究。首先,针对不能充分利用现有信息的问题,本文提出一种基于异构信息网络的有偏游走虚假群评论组检测算法。该算法根据用户和商品评价信息建立具有权重信息的异构信息网络,采用元路径上有偏游走的方法生成用户和项目节点的低维向量表示。对用户向量采用K-Means++得到候选虚假评论群组,根据检测指标计算群组怀疑度。检测出虚假评论群组。其次,针对之前算法负采样只能选取现有节点不能更好的模拟真实节点的问题,提出一种基于生成对抗网络的虚假评论群组检测算法。算法将数据集中的购买与被购买关系提取出来,通过生成对抗网络中的广义生成器和关系感知鉴别器互相训练,生成更具代表性的节点特征向量。利用聚类方法对用户嵌入进行聚类,根据指标对候选群组排序。最终得到虚假评论群组。最后,本文提出的算法,在Amazon评论数据集及Miami评论数据集上进行了实验,并和已有的算法进行对比,用实验验证了两种算法的有效性。
其他文献
随着近几年万物互联业务的高速发展,数据流量业务的指数式增长,频谱资源匮乏现象日益严重。频谱资源的二次利用,能在一定程度上解决频谱资源短缺的现象,提高频谱利用率。LTE-V2V通信网络不仅能实现V2V链路共享蜂窝用户的频谱资源,还能降低信息传输时延以及小区基站负载压力。但是,LTE-V2V通信网络在实现V2V链路复用蜂窝用户频谱资源的同时,蜂窝用户和V2V链路之间还会产生共道干扰,当共道干扰严重时将
火灾作为一种发生频率较高的多发性灾难,有着蔓延速度快、破坏性强的特点,严重威胁人民群众的生命财产安全。因此,及时检测到火情并进行预警,给疏散救援争取宝贵时间,对火灾的防治和保护人民生命财产具有重要意义。随着计算机视觉技术的发展和普及,基于计算机视觉的目标检测技术发展迅速。与传统的基于传感器的火灾监测技术不同,基于机器视觉的火灾监测技术需要使用的设备更加简单,检测精度更高,实时性更强,更加不容易受到
随着无线通信技术的发展,智能设备的接入数量快速增长,导致无线网络资源短缺,为了解决这一问题,学术界将能量收集视为一种解决能量供给问题的有潜力的方案。无线携能通信技术为无线通信网络中的信息传输和能量收集提供了有效的技术保证。将无线携能通信技术用于协作中继网络,增加了通信覆盖范围的同时,也延长了中继的电池寿命。但是,两者的结合也引发了一些问题和挑战,如能量收集和速率传输的权衡问题,以及如何解决多变量耦
随着人工智能技术的发展,虚拟康复已经成为一种有效的运动康复疗法,并被医疗机构和养老机构广泛接受。然而现有的虚拟康复方法在人机交互方面存在自然性差,训练过程不友好的问题,降低了患者的康复体验,导致很多患者难以得到最佳的康复治疗效果。本文针对上述问题,研究了面向虚拟康复姿势识别算法,并开发了相应的训练系统,具体研究内容如下:首先,设计了能满足患者多种康复需求的基于上下肢和躯干局部姿势组合的康复姿势集合
软件缺陷预测技术在软件生命周期中具有重要的地位,能够准确的捕捉到缺陷及其具体数目,定位到软件缺陷所在的具体模块有利于提高软件质量;保证软件的性能;节约软件测试成本。然而,具有缺陷的模块只占有很小的比重,导致在训练模型的过程中缺陷样本很难被捕捉,高维度的冗余特征也会影响最终的分类精度。此外,刚刚开发完毕的软件在各方面数据都不完善,特别是样本的标记情况,样本数量不足以建立精确的预测模型。因此,本文就上
近年来,随着微服务架构的出现和快速发展,使软件能快速满足市场不断变化的需求同时,也带来了许多问题。其中重要问题包括微服务的划分和划分的度量,一个优良的微服务划分方案能降低开发成本、提高开发效率和降低系统重构风险。目前对微服务划分原则和划分方法的研究已经基本成熟,但是对怎样的划分方案是一个合理的划分方案还没有一个共同的标准。就当前问题,以度量微服务划分方案的好坏为目标,提出了微服务划分方案的度量方法
近几年老龄人口比例快速提升,对老龄群体的看护服务问题日益凸显。家庭养老是我国现有的主要养老模式,室内意外跌倒是影响老人健康的重要因素,对于室内老年人跌倒事件的检测,有利于迅速地对老人实施救护,减轻跌倒造成的二次伤害。本文对于室内情境下的跌倒事件进行分析,基于人物交互原理设计了一种室内跌倒检测算法,以解决跌倒检测中因忽略场景信息导致的漏检和误检等问题。本文的主要工作如下:(1)针对现有算法对室内目标
伴随大量能源密集型与计算密集型应用程序的涌现,低延时与低能耗的任务处理需求对移动边缘计算(Mobile Edge Computing,MEC)提出了严峻挑战。论文兼顾用户响应性能及系统节能水平,在MEC端引入周期休眠模式与半周期休眠模式,融合虚拟机分簇技术,研究MEC任务卸载策略及系统性能。首先,为了提高系统的节能水平,提出一种融合虚拟机分簇与周期休眠的MEC任务卸载策略。在休眠定时器的控制下,备
麻醉药物引起大脑神经活动和血流动力学活动的变化,由于成人和儿童的脑发育程度存在差异,因此麻醉药物会对不同年龄段的大脑产生不同的影响。目前不同年龄麻醉下神经活动和血流动力学活动的变化尚未明确。分析神经血管耦合是理解药物作用于大脑机制的重要途径。因此本文以临床获取的数据为基础,对不同年龄段麻醉下神经血管耦合进行研究。首先,利用脑电(electroencephalography,EEG)和功能近红外光谱
人体上肢运动是在中枢神经系统(Central Nervous System,CNS)的控制下,多块肌肉间相互配合共同作用的结果,表现为运动相关肌肉间的相互耦合现象。在此过程中产生的肌电信号(Electromyography,EMG)包含了丰富的运动控制信息,通过研究多通道EMG间的耦合关系,可以探究CNS的控制机制和运动肌肉的协调配合方式。首先,分析了几种常见的生理电信号的产生机理和适用情况,并基