基于深度学习的文本情感分析研究及应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:coconutt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析是自然语言处理领域经典的研究方向之一,随着互联网以及电子商务的成熟,人们已经习惯在各种线上平台上消费。在线上平台消费之后,用户会对此次消费进行评论,这些评论信息日益增长,拥有很高的研究价值。对这些评价信息进行分析和挖掘,可以把握用户的喜好和消费需求,同时能对其他的消费者的消费行为提供参考意见,商家也可以根据消费者的消费需求,对产品不断进行改进和更新。传统的情感分析方法主要有基于规则和基于机器学习的方法。基于规则的方法需要构建情感词典,其情感极性分类效果取决于情感词典的质量,并且想要构建一个通用跨领域的情感词典很困难。而基于机器学习的方法需要构建特征和提取特征,这类特征通常无法表征文本的语义信息。因此,本文主要研究了深度学习方法在情感极性分类中的应用。本文的主要工作内容如下:(1)针对句子级的粗粒度情感分析任务,本文提出了一个多角度(全局最大池化、全局平均池化和注意力机制)增强句子表征能力的模型。只使用最大池化能提取出句子中重要的信息,但同时也会损失一部分有价值的信息。因此本文将全局最大池化、全局平均池化和注意力机制结合起来增强句子表征能力。该模型在Movie Review数据集上Accuracy值为82.41%,F1 score值为0.822。该模型在Customer Review数据集上Accuracy值为86.59%,F1 score值为0.862。均取得了不错的效果,在两个数据集上均优于其它基线模型。(2)针对方面级细粒度情感分析任务,本文提出了一个基于自注意力机制的模型。该模型使用两个基于自注意力机制的模块来进行句子表征,逐步获取20个特定方面的信息,最终一次性输出20个方面的情感倾向值标签。该模型在2018年AI Challenger细粒度情感分析数据集上取得了不错的效果,平均F1值为0.7084,平均Accuracy值为88.65%,优于其它基线模型。(3)将本文提出的模型应用到线上餐饮评论情感分析中,主要包括了数据抓取、粗粒度情感分析和方面级细粒度情感分析三个功能,验证了本文提出的模型的有效性和实用性。
其他文献
针对缺水型大城市多水源供水系统日益庞杂带来的规范化和精细化调配管理问题,通过强化最严格水资源管理制度对城市多水源统一调配和管理的指导作用,从前期调配评估、调配系统
<正>细胞凋亡(apoptosis)是一自然生理过程。是由一个主动由基因决定的自动结束生命的过程。由于细胞凋亡受到严格的由遗传机制决定的程序性调控,所以也常常被称为细胞程序性
相对湿度是文物保存环境的一个极其重要的参数,NOx耦合水分对于文物的破坏性很大。在前期开发的空气净化器的基础上,研究了空气净化和湿度调节系统集成技术和参数,考察了空气
介绍了宇宙空间及空间站内的辐射环境,针对各类太空辐射,选用合适的屏蔽材料、选择发射时机和运行轨道躲避强太空辐射,合理采用各种辐射防护方法和生物化学防护剂进行防护。
<正>1976年,英国电视剧《少女星》(Star Maidens)向我们展示了由女人统治的美杜莎星球和地球之间的冲突。两个来自美杜莎星球的男人,亚当(皮埃尔·布赖斯饰)和希姆(加雷思·
理解微观的、动态变化的细胞代谢,往往是通过某物质量的变化展开。对细胞代谢过程中某一物质的含量、生成量或消耗量、积累量或减少量进行分析,以便更好地理解抽象的细胞代谢
STEAM教育是一种多学科融合的综合性教育理念和教育模式。核心素养是信息时代人的发展的共同目标,体现了世界教育发展的趋势,同时也是我国贯彻落实立德树人根本任务的必要路
<正>电影学者如今在探询电影演员在画面中对形体和声音的运用会如何增强影片美感的问题。1988年,詹姆斯·纳雷默以《电影中的表演》一书为这种探询奠定了基础。近来,在《银幕
<正>在世界格局和国际力量对比都在发生着深刻变化的背景下,作为"人类发展的最后边疆",非洲大陆日益成为西方大国与新兴发展中国家竞相争取的合作对象——精彩导读西方大国近