面向产品评论的共指消解方法研究与实现

被引量 : 0次 | 上传用户:yaoyaoyy1188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
共指是自然语言领域中广泛存在的现象,所谓的共指消解任务(Coreference Resolution),就是利用一篇文档中的上下文信息,结合各个表述本身内容的特征,将同一对象的不同表述方式对应到具体实体(Entities)的过程。近年来,产品评论作为用户在网络媒体上对产品发表意见的重要载体被学术界广泛研究。由于用户的知识背景以及语言习惯不同,不同用户对产品同一属性的表达方式有所不同,这一共指现象导致产品评论中产品属性描述过于繁多、琐碎,不利于计算机的分析与理解,因此,产品评论的共指消解是意见挖掘领域亟待解决的重要问题之一。本文根据中文产品评论的语言特点,探讨了产品评论中产品属性的共指关系,并分别采用聚类和分类方法来研究汉语产品属性共指消解问题。具体地,本文工作主要体现在以下三个方面:(1)针对中文产品评论的语言特点,从词形、词义和上下文等三个语言层面探索了共指产品属性之间的联系,并以此为基础分别构建了相应的产品属性相似度计算方法,为产品共指消解的聚类和分类特征选取提供理论依据。(2)本文以机器学习二元分类方法为基本框架,构建了基于有监督学习方法的共指消解系统。并对系统中Mention识别、共指关系判断、共指链生成三个关键步骤展开研究讨论,分析比较了不同特征、分类器对共指消解性能的影响。实验结果表明了在机器学习二元分类框架下融合词形、词义以及上下文特征的共指消解方法的有效性。(3)本文采用层次聚类算法以及K-Means聚类算法构建了无监督的产品属性的共指消解系统。结合本文共指消解的具体任务,探讨了聚类算法中特征权重选择、K值选择、初始聚类中心选取的相关问题,通过实验结果表明,基于密度以及最大最小原则的初始中心选取方法能够有效提高基于聚类方法的共指消解系统性能。
其他文献
进入21世纪以后,随着创新驱动发展战略的不断深入,技术创新正加快为经济、社会发展提供不竭动力。如今,国家推出鼓励企业创新的政策越来越多,企业管理者对技术人才的引进也越
<正> 人物对话是表现人物性格的重要方面。出色的人物对话最能体现人物的性格特征,在这方面,《荷花淀》的对话堪称艺术的典范。请看水生夫妇月夜下的对话:
同伴关系在初中生价值体系中居于首位,它是青少年身心健康与社会适应的重要指标,其影响着学业、情绪及行为适应的各个方面。消极的同伴关系既会阻碍青少年的学业与人格的发展
目的:观察点穴开筋疗法对急性颈痛患者的即时治疗效果,探讨点穴开筋疗法的效应机理,为临床即时缓解颈痛急性期患者的痛苦找到一种更快捷、安全、高效的治疗方法。方法:将入组61
从顶岗实习学生状态、学校管理、企业重视程度、实习成绩考核、实习岗位、工学结合程度等六方面分析现存问题,从开发深层次校企合作实习基地、加大有经验专业教师对顶岗实习
词汇量是衡量学习者语言水平的重要标准,口语、听力、阅读和写作的能力都受到掌握词汇多少的影响,词汇量还制约着语言水平的提高,因此词汇教学一直以来都被视为对外汉语教学
随着智能变电站的大规模建设,变电站运维检修技术面临了新的机遇和挑战。一方面,智能变电站采用了智能化的二次设备,二次设备间则大量采用了光纤进行连接,与传统变电站相比,
儿童在成长发展中,在个性形成的关键时期,大多数时间是在家中度过,受家庭教育的影响,父母对子女进行教育的科学性是孩子一生健康成长的关键。3-6岁是儿童生长发育的关键期,这
玉米是重要的粮食、饲料作物,同时被广泛用于食品、工业加工和新能源开发等方面。随着畜牧业、工业的发展及世界人口的增长,玉米在人们生活中的地位越来越重要。因此,提高玉