基于机器学习的评论情感分析系统设计与实现

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:wangke8611
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的快速普及,人们使用网络的目的也发生了巨大变化,电商平台的出现也极大的改变了人们的消费方式,随之而来的互联网评论信息也使得人们在进行决策行动之前有了更多的参考。就各大酒店预定平台使用过程来说,用户通过浏览酒店的评论信息来获得更直观的判断。通过对酒店的评论数据进行情感分析,可以清晰地了解到用户对于酒店的客观评价以及入住体验,从而帮助其它用户进行快速决策,选到合适的入住酒店,降低用户的选择时间成本。对于中文文本情感分析任务来说,结果的好坏很大程度上取决于情感特征的构建,由于中文文本表达形式多样,情感特征往往存在空间维数高,表示稀疏,缺乏文本语义信息等问题。为了解决以上问题,本文以机器学习算法为基础,结合自然语言处理的语言模型,对文本情感特征提取与表示方法进行研究,使用机器学习模型来进行情感极性判别分析。并且基于所提情感分析模型,设计并实现了酒店评论情感分析系统,用户可以通过本系统查询太原市的酒店分布地图,酒店满意度地图,以及酒店评论的情感分布等信息,最重要的是,本系统可以针对用户酒店评论信息进行实时情感分析。具体来说,本文主要包括以下3个方面的工作:(1)酒店评论语料库的构建:由于标准数据集在实际情感分析任务过程当中的不足,本文结合现有的网络爬虫原理以及相关技术方法,对去哪儿网酒店评论信息进行采集与存储,构建了积极、消极两种情感类别的大规模酒店评论语料库。(2)中文文本特征提取与表示方法的研究:本文将结合不同的词向量在进行文本表示中的差异,融合多种词向量的优势,详细介绍了基于粗糙集和多通道词向量的文本情感词特征表示方法RS-Word2vec⊕Glo Ve(RS-Wv Gv)的实现过程。(3)酒店评论情感分析系统的设计与实现:本文设计并实现了基于机器学习的酒店用户评论情感分析系统,将所提中文文本情感分析模型嵌入到情感分析系统相关模块当中,满足用户的数据可视化与情感分析的需求。
其他文献
膜性肾病(MN)是成年人肾病综合症的一种常见类型,发病率高达23.4%。肾穿刺活检是膜性肾病诊断的金标准,传统的病理诊断方法需要医生在显微镜下对肾小球基底膜上的免疫复合物沉积程度进行判断,如此庞大的工作量极易导致误诊漏诊。另一方面,经过调查我国的病理医生缺口高达9万人,因此使用计算机自动辅助医生诊断膜性肾病迫在眉睫。然而计算机算法实际应用过程中仍然存在很大的问题,病灶大多位于肾小球内且非常微小。若
农村幼儿园教育、尤其是偏僻落后的农村幼儿园教育,与城市幼儿园教育相比还存在很大差距。要想缩小这些差距,使幼儿教育实现城乡的均衡发展,还需要对农村幼儿园在结构调整、政策支持、更新观念、检查督导等方面进行不懈的努力。
语言是人类交流最方便、最快捷的方式,语言中包含的情感信息在交流时发挥着重要作用。让机器像人一样具备说话、思维和情感能力,是人工智能领域一直追求的目标。语音情感识别的研究,将推动这一目标的逐步实现。近年来,深度学习被应用于各个领域,且取得了非常好的效果。深度学习也被成功的应用于语音情感识别领域,主要被用来提取显著的、更为泛化性的情感特征和建立情感分类模型。语音情感识别除了建立合适的数据库外,主要包括
特钢棒材作为重要工业设备零部件的原材料之一,是目前冶金行业的重要产品,在生产加工过程中,由于轧制设备,加工工艺等因素,特钢棒材表面不可避免的会出现各种外部缺陷,这在影响产品外观的同时会导致特钢性能发生变化,造成韧性、抗弯强度和耐磨性等指标下降。而随着市场对产品要求的提高,原材料的表面质量也变得至关重要。为了能够有效控制特钢棒材的出厂质量、改进特钢棒材生产工艺因此、研究表面缺陷的形成原因,对特钢棒材
在当今社会中,中风导致很多人长期残疾。中风患者在发病后出现腕部功能丧失,无法实现手腕伸屈、内收和外展等一些基本的手腕动作,严重地影响了患者日常生活。采用康复机器人进行手腕康复训练是促进患者康复的重要手段之一。康复机器人实时监测患者上臂及手腕的肌肉电信号,通过控制系统发出运动指令,促进患者神经系统功能重组,有效缓解肌肉和关节萎缩,帮助患者恢复身体机能。其中,控制系统发出的运动指令基于肌肉电信号与手腕
我国是世界上最大的苹果生产国和主要消费国,在世界苹果产业中占有重要地位,因此对其生长发育的观测变得至关重要。作物物候资料不仅仅是研究作物生长过程与农业气象条件关系的重要基础数据,也是指导田间农事管理活动的基础,因此,其是农业生产、管理和农业气象观测的重中之重。长期以来,作物观测主要是通过人工方式进行的,即通过定点、定时的眼观察、手记录方式,对一年当中生物物候现象的变化进行跟踪记录。对于偏远果园、复
随着直缝焊管应用越来越广泛,其焊缝作为整根焊管最为薄弱的位置往往需要突出检测以满足实际场景的使用要求。本文依据水压机对直缝焊管进行静水压试验时,需要控制焊缝位置来观察焊缝处是否存在泄露的要求,提出了基于机器视觉来判断直缝焊管焊缝位置的方案。直缝焊管的焊缝位置在焊管上属于周向特征,位置信息为三维信息。本文通过单目视觉检测旋转中的直缝焊管焊缝距离目标位置的偏角,对转动停止时间进行控制,使焊缝最终停在目
分布式共识算法是分布式系统的基础,通过对多个副本节点执行的命令序列达成共识,达到副本的最终一致。随着分布式系统的发展,越来越多的系统被部署在地理跨度大的广域网环境中,它们对分布式共识算法提出了进一步要求,希望其在保证系统正确运行的前提下,能使用尽可能少的延迟对命令达成共识,提升系统性能。Paxos算法是最具有代表性的分布式共识算法,分两阶段完成:选举领导者阶段(Leader election ph
伴随着外骨骼理论及技术的逐步成熟,外骨骼设备已广泛应用于社会的各个领域。考虑到由于矿井下有许多繁重的体力劳动,因此本文提出研制外骨骼机器人来辅助人工完成这些重体力作业。本文以矿用外骨骼机器人的驱动系统为研究对象,应用外骨骼运动学相关知识和软件建模及仿真等手段,对矿用外骨骼机器人的驱动系统进行了详细的分析研究。具体内容如下:(1)对外骨骼机器人的关节配置及驱动理论进行分析研究。根据拟人化仿生机械相关
近年来,随着物联网技术的不断发展,与物联网相关的环境感知、数据传输和云端计算等技术已成为热门的研究方向。物联网感知层的主要目的,是将物理世界的模拟信号转换为计算机能传输、存储和计算的数字信号。感知层中的主要任务是对用户和物品的定位,以及对用户的认证和行为动作的感知。其中用户认证部分是物联网感知层的关键技术,在对用户身份认证后,才能进一步提供个性化服务。本文重点研究采用射频识别(Radio Freq