面向目标属性的细粒度意见挖掘算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:longfei256
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
意见挖掘是对具有主观情感的语言文本进行意见信息提取的过程,是自然语言处理领域的核心任务之一。其中细粒度的意见挖掘可以对指定目标进行精准化意见抽取,具有非常重要的理论研究意义和商业应用价值。随着深度学习的发展,利用神经网络进行细粒度意见挖掘成为一种主流方式。然而分析粒度的细化导致神经网络对关键信息捕获的难度急剧增加,在分析含有多个不同情感属性的评论文本时尤为突出,该类复杂文本中各类无关信息对目标属性的意见提取造成严重干扰。此外,多数细粒度意见挖掘任务只针对目标属性进行情感极性分类,无法完全表示目标属性的具体情感信息,致使意见挖掘不完整不全面。针对以上问题,本文以面向目标属性如何进行全面精准的意见挖掘为出发点,提出细粒度意见分类方法和意见词抽取方法。一方面,通过目标属性与文本之间进行相互指示关键信息位置,从而对相关文本赋予强关注,实现文本的纯化表示。另一方面,通过融合意见类别特征来增强情感指导能力,实现意见倾向性解释词的获取,对目标属性构成更全面完整的意见信息挖掘。本文的主要贡献如下:(1)提出一种融合多头交互指示机制的细粒度意见分类方法。设计多头交互指示机制,将目标属性与评论文本进行多头注意力机制计算,同时提取双方相关重要特征信息,从而去除与目标属性无关信息的语义编码干扰。设计中性标签平滑机制,在极性输出中添加噪声对模型进行约束,缓解隐含情感倾向的中性类别不可信问题,降低模型过拟合风险。引入Bert动态词嵌入模型,根据上下文微调不同语境文本向量,提高非结构化文本转化准确率。(2)提出一种联合目标情感极性的细粒度意见词抽取方法。设计极性指导机制,将显式的意见类别特征结合至属性隐层,利用情感极性类别信息来辅助指示下游语义编码。引入一种特殊的双向门控循环神经网络和自注意力机制,将目标属性与文本信息充分融合,实现对不同的目标属性、相同的评论文本提取更为有效的不同语义表示。通过对情感类别原因词的提取,加强了意见信息挖掘的全面性。本文是针对目标属性的全面性细粒度意见挖掘研究。实验结果表明,本文方法能有效提高意见分类精度,同时准确提取意见词,从而构成完整的信息挖掘。
其他文献
为研究不同脂肪添加水平及比例对荷斯坦公牛生长性能、瘤胃发酵、消化代谢及血液指标的影响,本试验选用4头装有永久性瘤胃瘘管的荷斯坦公牛,年龄4.5岁,平均体重580±50kg,以精补料和玉米青贮为基础饲粮,在饲粮中分别添加4%、5%、6%三个脂肪添加水平,在每个添加水平下,用胡麻籽油制作的过瘤胃脂肪和胡麻籽两种脂肪按照4个不同配比100:0、85:15、70:30和55:45,采用3×4两因素设计,即
作为电力系统直接面向终端用户的最后一个环节,配电网的运行程度直接关系到用户用电质量和可靠性,保障配电网的安全对于电力系统长期稳定运行具有重要意义。而传统配电网通常
目的:观察胰高血糖素样肽-1受体激动剂(glucagon-like peptide-1 receptor agonist,GLP-1RA)治疗应用二甲双胍控制不佳的合并早期肾损伤的肥胖2型糖尿病患者的有效性及安全性。方法:选取2019年1月至2019年12月就诊于邯郸市中心医院内分泌科的合并早期肾损伤的肥胖2型糖尿病患者63例,入组患者均应用二甲双胍单药或联合其他口服降糖药物治疗但血糖控制仍不达标
随着全球经济金融和科技的快速发展,各国在贸易与金融及其他行业的合作也变得越来越频繁.分红与注资一直以来是金融和保险领域备受关注的热点课题.为此对寻求更加符合金融市场实际运营的模型就显得尤为必要.由于Lévy过程具有独立平稳增量性,马尔可夫性,无穷可分性等良好的性质.能够更加符合实际的模拟金融市场运行规律,很好的刻画资产的运营过程.除此之外Lévy过程的样本路径具有间断点,可以刻画金融资产价格运动中
光电化学(PEC)水分解体系利用太阳能将水分解产生氢能,是提供新型可再生能源的重要手段。由于光阳极的水氧化反应为四电子转移过程,制约着水分解性能的整体效率,所以提高光阳极
本报告是基于笔者在石家庄举行的2019年中国自由搏击职业联赛中的陪同口译实践经历,选取部分口译内容为案例分析对象,以释意理论为指导,分析了笔者在实际口译过程中遇到的问题和口译策略。本报告分为四章。第一章是对此次口译任务的描述,介绍了此次口译任务的背景、任务性质以及任务委托方的要求。第二章介绍任务过程,叙述了笔者在此次口译任务中的译前准备、口译过程以及译后评估等。第三章为案例分析,笔者以释意理论为指
政府监管是推进国家治理体系和治理能力现代化的重要工具。传统社会性监管重视政府和监管对象之间的互动,而忽视了公众诉求对政府监管的有效作用。运用北京市政务热线大数据,
目的:体外研究外源性硫化氢(GYY4137)对绝经后骨质疏松症患者骨髓间充质干细胞(BMMSC)增殖和成骨分化的生物学影响及探讨其可能机制。方法:取绝经后骨质疏松性骨折行全髋置换治疗的患者20名,术中自股骨近端做骨髓取样用于细胞培养。采用全骨髓贴壁法行原代细胞培养获得h-BMMSC,利用流式细胞技术鉴定。以有限稀释法纯化获得纯度较高的原代h-BMMSC。MTT法检测外源性H_2S供体GYY4137
自2008年中国首家社区基金会成立以来,社区基金会参与基层治理已经成为社区公益慈善事业发展的新现象。国内政府主导型社区基金会成为主要研究对象。在理论层面,本研究基于回
本实验报告研究的是知识图式对交替传译流利度的影响。知识图式指与文本内容相关的背景知识,在口译中体现为译者对口译主题的熟悉程度。目前,国内外已有研究表明,知识图式与