基于多维特征与深度学习的虚假评论识别研究

来源 :内蒙古大学 | 被引量 : 4次 | 上传用户:a563241195
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的快速发展,越来越多的消费者开始倾向于网上购买商品,并对商品进行评论。为了做出正确的购买决定,消费者不仅会看商家给出的商品信息,还会阅读大量有关商品的评论。然而,商家为了自身利益,往往雇佣专业写手为自己撰写虚假好评,吸引潜在消费者购买商品,为竞争对手撰写虚假差评,打压竞争对手。这不仅误导消费者做出错误的购买决定,也不利于电商平台的稳定发展。因此,亟需有效的方法来检测虚假评论。本文基于评论内容和评论者行为人工提取了多维特征,使用传统机器学习方法建立模型来识别虚假评论。此外,采用深度学习的方法提取了深层语义特征,与多维特征结合,构建了DF-HAN模型来检测虚假评论。本文主要的研究内容如下:(1)构建了五种特征指标。通过分析评论的内容提取了N-gram特征、词汇特征、可读性特征和主题特征四类文本特征;通过分析评论者的行为提取了行为类特征。针对行为特征和四类文本特征构建了五种特征指标。(2)构建了使用传统方法识别虚假评论的模型。将提出的五种特征指标整合,使用LR、SVM、RF三种分类器构建模型。最后分类的F1值为87.37%,验证了该模型的有效性。(3)构建了使用深度学习方法识别虚假评论的模型DF-HAN。该模型采用LSTM和双向GRU挖掘深层次的语义特征,采用CNN处理本文提取的传统离散特征,该特征是多维的。然后将语义特征与传统特征连接,建立DF-HAN模型。与HAN模型85.99%的准确率相比,DF-HAN模型获得了更高的准确率91.76%,验证了本文提出的模型的有效性。
其他文献
随着世界上环境污染和能源危机问题日益突出,清洁、可再生的风能资源越来越受到各国的重视,风电并网容量在不断增加。然而,利用变频器控制的风电机组通常与系统频率完全解耦,
在紧张的历史与社会中考复习中,教师主要是帮助学生梳理各个知识点的内在联系,同时帮助学生有技巧地读书,最后要在练习中训练学生的考试技能。为此,教师一定要做到有计划、有
随着房地产市场的快速发展,物业管理已逐渐成为房地产经营管理的重要组成部分。但是,作为一个新兴的行业,其在发展过程中遇到了很多困难,其中物业管理收费难的问题尤为突出。
知识经济时代,知识管理的重要性突显出来,而对知识传播规律的研究可为知识管理的决策提供依据.本文针对知识经济下知识传播的特有现象,依据个体对知识的掌握程度,将研究团体
<正>培养学生口语交际能力是新课程的主要目标之一,也是应试教育向素质教育转轨的重要措施。学生口语交际能力提高的方法是多种多样的,但兴趣的激发和培养不可或缺。网络上有
<正>势时虽逐变,才情亦不散。大计论复兴,科技作先锋。当今,共建丝绸之路经济带战略的号角已经吹响,国际社会的目光再次聚焦天山南北,建设洪流开始滚滚涌入亚心之都,大量有利
小学综合实践活动的课程管理与教学设计,既要结合学生的知识背景和学习特点,又要强调在相同教学设计和教学内容上,针对年级不同、学习兴趣不同,选择和设计不同层次的活动目标
针对高速公路附属小区规划设计中无视建筑地域性的问题,阐述了地域化设计的必要性和必然性,提出了小区地域化设计的基本原则。笔者通过对安徽省庄里服务区和屯溪主线管理区两
<正>深秋10月,坐落在绿树环绕中的昌吉国家高新区呈现出一派生气勃勃的景象。今年以来,昌吉国家高新区努力克服经济下行带来的诸多不利因素影响,深入贯彻落实昌吉州党委、州
为了更加清楚、全面地了解儿童睡眠障碍的有关情况,从专业角度对睡眠障碍的病因、临床表现、诊断和防治进一步做了较为详细的探讨。
会议