面向事件的文本表示模型构建及应用研究

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:ntudqliweiwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本表示是自然语言研究的基础问题,也是帮助我们高效处理文本信息的关键,传统的文本表示模型大多是基于词或短语构建,普遍存在容易丢失语义信息的问题。近年来,事件这一概念引起了学者的高度重视,叙事类文本中包含了大量的事件,面向事件对文本表示模型进行研究,以事件或事件要素作为语义单元,可以很好的保留文本中存在的深层语义信息。本文首先对文本中缺省的对象要素、时间要素和地点要素进行缺省补全的研究;然后以事件作为基本语义单元,结合图结构模型的思想,构建面向事件的文本表示模型——事件语义网络;最后基于事件语义网络实现了自动摘要应用。论文主要的研究内容分为以下三个部分:(1)事件要素的缺省补全。在一篇叙事类文本中,为了使叙述更加连贯流畅,常常会出现对象要素、时间要素和地点要素的缺省,将缺失的事件要素补全是事件要素研究的一个重要问题。本文主要对事件缺省的时间要素、环境要素(地点要素)以及对象要素进行补全研究。其中时间和地点要素同为事件的属性,使用基于上下文结构规则结合相同事件触发词表的方法进行补全;对象要素使用基于上下文结构规则和事件在句子中的共现规则相结合的方法进行补全并计算具有多个对象要素的事件在文本中的语义关联。给出了具体的补全步骤和对应的实例以及事件要素缺省补全的实验效果。(2)面向事件的文本表示模型-事件语义网络。本文将事件作为研究对象,用事件中的触发词(动作要素)代替事件作为特征项。同时结合图结构模型的思想,深入挖掘事件之间的语义关联:首先针对不同的事件要素根据其特点使用不同的方法计算事件要素之间的关联度,然后为不同的事件要素赋予不同的权重,通过加权公式使用事件要素的关联度计算出事件之间的相关度,并根据事件相关度的大小将相关的特征项连接起来作为边,最终构建出一种新的文本表示模型-事件语义网络,能够很好地保留文本的结构和语义信息。(3)基于事件语义网络的自动摘要。统计出事件语义网络中每个特征项的权重,从而得到每个节点的权重;然后通过改进的PageRank方法对得到的节点权重进行计算,得到每个节点在文本中的重要度;接着通过更新后的节点重要度得到文本中对应事件所在句子的权重,并将句子按照权重大小降序排列,挑选权重最高的部分句子作为文本的摘要句;最后将得到的文摘句进行去冗余操作后按照它们在原文本中出现的顺序依次输出,作为文本的摘要。实验表明,基于事件语义网络的自动摘要方法取得了较好的效果。图[9]表[11]参[61]
其他文献
随着长三角区域一体化上升为国家战略,安徽省的经济发展将会得到进一步提高。城市的发展势必会对区域内现有的资源造成一定的影响,相反,区域内现有的资源也会制约城市经济社会的可持续发展。城市水资源作为承载经济社会发展的重要因素之一,关系着人们的日常生活,关系着区域内产业的生存与高质量发展,关系着社会的和谐与进步。可见,分析评价地区水资源承载力变化特征,采取有效措施应对水资源承载经济发展中的问题,对于合理规
施工组织设计的合理编制和实施,能够在符合相关的建设法规和满足建设单位的要求之上有效地改善施工单位自身的经济效益。本文以淮安东站综合客运枢纽工程站前广场进行施工组织设计为主要研究内容,结合国内外有关施工组织设计的研究成果,根据淮安东站综合客运枢纽工程站前广场施工特点、工程管理目标等情况对施工进度安排、施工资源配置、施工平面布置、主要工程施工方案等作出具体的施工组织与规划。基于层次分析法和模糊综合评价
硒是人体必需的微量元素,缺失或过量都会对健康产生不利影响。硒在土壤中分布极不均匀,而当前国内外研究多关注富硒或过量地区,采集的土壤多选自普通农用地,相关的分析以单一行政区域为研究单元,未体现地域的差异性。而研究硒在不同地域内分布规律、揭示土壤富硒特征,对于指导富硒农业产业宏观规划和富硒土地资源开发利用具有重要意义。本文以旱作区农田和矿区复垦农田为研究对象,借助变异函数、冷热点分析、地理探测器等方法
目的探讨腹腔镜辅助经肛门全直肠系膜切除保肛根治术—人工吻合法在低位直肠癌保肛治疗中的应用,分析其手术时间、出血量、淋巴结清除数、远切缘距肿瘤下缘距离、患者术后术后3个月及6个月肛门功能Wexner评分、手术效果、术后并发症、术后1年及2年生存率和肿瘤复发率。方法匹配研究,同济大学附属第十人民医院胃肠外科,从2018年11月至2020年11月,根据手术适应症及意愿接受腹腔镜辅助经肛门全直肠系膜切除保
该论文主要设计并制备出层状硅酸镍(NiPS)及其纳米杂化材料,并将其引入环氧树脂(EP)作为功能填料,制备出EP纳米复合材料。首先通过各类现代测试技术对所制备的纳米填料进行微结构、热性能和成分的表征,而后针对填料的含量对复合体系的摩擦磨损特性、力学性能、燃烧行为和固化过程的影响规律进行了详细而充分的研究,主要研究结果如下:(1)以气相二氧化硅(SiO2)作为硅源以及硬模板,以硝酸镍(Ni(NO3)
无线传感器网络WSN凭借其自身所具有的低成本、自组织、长生存周期等优势,广泛应用于电网监测、海底勘探、军事管理、医疗护理等领域。但是无线传感器网络工作环境复杂多变,传感器能量受限且不能补充,因此无线传感器网络的核心研究问题便是网络覆盖优化控制,可以说网络覆盖控制决定了 WSN的性能和服务质量。采用高效合理的网络覆盖控制策略,能够优化传感器节点的部署,从而使WSN更好的服务于用户。故本文针对二维网络
奇异微分系统是微分方程与动力系统的一个重要领域,其在应用数学、天文学、物理学以及生物学科中有着广泛的应用。因此,探讨奇异微分系统周期解问题具有很高的学术价值。本文应用重合度延拓定理、上下解方法、三阶近似方法、平均方法研究了几类奇异微分系统周期解的存在性和稳定性问题。全文的组织结构如下:第一章,绪论,简述奇异微分系统的背景、研究现状和意义。同时给出了重合度定理、上下解方法、三阶近似方法、平均方法一些
因果中介分析是通过中介变量识别解释自变量和因变量之间关系的因果机制。目前,中介分析的研究主要集中在自然直接与间接效应推断,很少进行效应的估计与分布的研究。本文分别在简单中介模型、具有混杂变量的中介模型、具有交互作用的中介模型和具有多个中介变量的中介模型下进行了自然直接与间接效应估计,并由Delta方法获得了估计量的分布。论文的主要工作包括以下四个部分。第一部分对单个中介变量情形,运用线性回归建立自
随着现代通信技术的发展,对相关元器件的需求也越来越大。这些年,微波介质陶瓷发展迅速,是因为由其制作的微波元器件,有不少优点,例如小巧、经济、质量轻、性能稳等,因此可以满足现代通信工具的小型化、集成化等要求。低温共烧陶瓷(LTCC:Low Temperature Co-fired Ceramic),是一种多层电路,由未烧结的流延陶瓷材料叠层在一起制成,内置印制互联导体、电路和元件,该结构被烧结成一个
移动互联网和智能终端设备可以产生大量的高维数据,这些数据具有潜在的规则和价值。然而,如果不经净化处理直接发布,可能会泄漏用户或组织的隐私信息。现有的高维数据差分隐私发布方法不能够较好地保护用户隐私。一方面,中心化差分隐私无法解决不可信服务器导致的隐私泄露问题,以及应用于众包场景存在诸多问题;另一方面,差分隐私作用于高维数据上不仅会引入大量的噪声,降低数据效用,也会产生时间复杂度高、计算复杂等问题。