论文部分内容阅读
随着互联网的发展进入新的时代,媒体行业快速发展,微博成为国内人民获取信息和发表观点的媒介。微博中包含了大量的文本信息,如时事热点,社会现象,经济信息等以及对微博内容的评论。使用计算机技术对微博上展示的文本数据进行情感分析,将会帮助相关部门、企业和机构对于公众的观点态度进行精确的了解,分析事件所产生的影响。为相关部门、企业和机构进行合理的舆情分析及监控,制定舆情应对与解决的策略并提供准确的参考信息,同时针对各个领域的微博舆情分析可以了解各行业和其产品情况,对行业的发展有着积极的促进作用。本文研究与实现基于舆情分析的微博情绪监测系统,对微博文本数据进行虚假微博评论的去除,获取真实的用户评论数据提高了微博文本数据进行舆情分析的准确率。主要使用了PU LEARNING算法和LSTM算法。融合PU LEARNING模型和LSTM模型,提出了一种基于虚假评论识别和深度学习的情感分析模型简称为PU-LSTM模型。1.首先使用PU LEARNING算法对获取的微博评论数据进行数据预处理和向量化。2.然后提出三大评价指标,8个判断属性。状态指标、内容指标和行为指标,下设8个属性为:用户可信度、用户评价时效性、用户评论文本长度、评价内容与主题的相关性、评论内容包含敏感词比例、在线评论相似度、用户注册时间间隔和情感表达强度。3.通过以上指标运用PU LEARNING模型对虚假评论标注,剔除虚假评论。4.最后基于剔除虚假评论后的文本数据使用LSTM算法来实现对文本的舆情分析。在系统实现过程中使用API等引入,获取热点微博做出热力图,并使用LDA算法提取出各个情感维度的关键词,以词云的方式进行展现。PU-LSTM模型能够帮助使用者针对真实的用户评价进行分析从而获得较为准确的舆情分析结果。实验结果验证了本文所设计并实现的微博舆情分析监测系统可以有效地完成了各项预期功能。但本文具有一定的局限性,由于数据集偏差导致实验结果的偏差和算法具有的部分缺点并不能对舆情进行更加精确分析,同时不能对虚假评论所产生的一系列影响进行分析,以及为对舆情分析结果提出专家系统对策。