基于概念关系对齐的中文抽象语义表示解析评测方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wuyidan0908
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抽象语义表示(Abstract Meaning Representation,AMR)是一种句子语义表示方法,能够将句子的语义表示为一个单根有向无环图.随着中文AMR语料库规模的扩大,解析系统的研究也相继展开,将句子自动解析为中文AMR.然而,现有的AMR解析评测方法并不能处理中文AMR的重要组成部分——概念对齐和关系对齐信息,尤其是关系对齐中对应到有向弧上的虚词信息.因此,为了弥补中文AMR解析评测在这两个方面上的空缺,该文在Smatch指标的基础上加入了描写概念对齐和关系对齐的三元组,得到用以评测中文AMR的整体性指标Align-Smatch.选取100句人工标注语料与标准语料进行评测对照实验,结果显示,Align-Smatch有效兼容了对齐信息,对有向弧的评测比Smatch更合理.该文还提出了概念对齐指标、关系对齐指标、隐含概念指标共三个分项指标,以进一步评测中文AMR解析器在对齐子任务中的分项性能.
其他文献
消防水泵的启动是消防水灭火系统最重要环节,如何有效启动消防泵,保障灭火的可靠性,规范给出了多重保障措施,既有泵房现场手动启动、机械应急启动,也有消防控制室远程启动,还有火灾自动报警系统联动编程启动,但对于屋顶消防水箱流量开关启动消防泵,一直有争议,文章通过高铁站工程实例探讨研究流量开关启动消防泵的不必要性.
随着科学技术的飞速发展,信息化铁路应运而生,电子客票代替了纸质车票,智能检票代替了人工检票,高铁代替了慢速列车,智能服务代替了传统服务,从里到外,从小到大全方位便捷了旅客的出行.
随着城市化的发展,民众对城市环境的要求在不断提高,现代化城市治理成为城市发展相关部门关注的焦点.数字化管理是现代技术发展的由来,尤其是信息技术应用的一种新模式,是不断发展和相关传统管理部件调查流程的重组,是建设的有益尝试.为了履行社会治理和服务的职能,消除城市治理中的信息鸿沟,积极推进数字城市部件调查.基于此,文章讨论了城市部件调查内容与方式,分析了城市部件数据采集方式,基于数字化测量和外业部件采集,全面提升部件调查及数据采集质量.
铁路物流中心占地面积大、功能分区多、用电设备多,电力设计比较复杂.本文结合工程设计实例,从负荷分级、变配电所、远动系统设置、站场照明及控制、防雷接地等方面进行阐述,以供类似工程项目参考.
文章深刻剖析了某油气企业办公楼智能化建设和管理使用现状,梳理其中存在的问题,指出新时期办公楼宇智能管控和高效运营的具体需求,并以此油气企业办公楼智能化管理系统建设为例,提出具体的技术解决方案,建立统一的技术性标准和规范.
关系分类作为构建结构化知识的重要一环,在自然语言处理领域备受关注.但在很多应用领域中(如医疗、金融等领域)收集充足的用于训练关系分类模型的数据十分困难.近年来,仅需要少量训练样本的小样本学习逐渐应用于关系分类研究中.该文对近期小样本关系分类模型与方法进行了系统的综述.根据度量方法的不同,将现有方法分为原型式和分布式两大类.根据是否利用额外信息,将模型分为预训练和非预训练两大类.此外,除了常规设定下的小样本学习,该文还梳理了跨领域和稀缺资源场景下的小样本学习,探讨了目前小样本关系分类方法的局限性,并分析了跨
机器翻译错误分析旨在找出机器译文中存在的错误,包括错误类型、错误分布等,它在机器翻译研究和应用中发挥着重要作用.该文将人工译后编辑与错误分析结合起来,对译后编辑操作进行错误标注,采用 自动标注和人工标注相结合的方法,构建了一个细粒度英汉机器翻译错误分析语料库,其中每一个标注样本包括源语言句子、机器译文、人工参考译文、译后编辑译文、词错误率和错误类型标注;标注的错误类型包括增词、漏词、错词、词序错误、未译和命名实体翻译错误等.标注的一致性检验表明了标注的有效性;对标注语料的统计分析结果能有效地指导机器翻译系
基于大规模语料训练的语言模型,在文本生成任务上取得了突出性能表现.然而研究发现,这类语言模型在受到扰动时可能会产生攻击性的文本.这种不确定的攻击性给语言模型的研究和实际使用带来了困难,为了避免风险,研究人员不得不选择不公开论文的语言模型.因此,如何自动评价语言模型的攻击性成为一项亟待解决的问题.针对该问题,该文提出了一种语言模型攻击性的自动评估方法.它分为诱导和评估两个阶段.在诱导阶段,基于即插即用可控文本生成技术,利用训练好的文本分类模型提供的梯度方向更新语言模型的激活层参数,增加生成的文本具有攻击性的
抽象语义表示到文本(AMR-to-Text)生成的任务是给定AMR图,生成相同语义表示的文本.可以把此任务当作一个从源端AMR图到目标端句子的机器翻译任务.目前存在的一些方法都在探索如何更好地对图结构进行建模.然而,它们都存在一个未限定的问题,因为在生成阶段许多句法的决策并不受语义图的约束,从而忽略了句子内部潜藏的句法信息.为了明确考虑这一不足,该文提出一种直接而有效的方法,显式地在AMR-to-Text生成的任务中融入句法信息,并在Transformer和目前该任务最优性能的模型上进行了实验.实验结果表
任务型对话系统中的自然语言生成模块(ToDNLG)旨在将系统的对话动作转换为 自然语言回复,其受到研究者的广泛关注.随着深度神经网络的发展和预训练语言模型的爆发,ToDNLG的研究已经获得了重大突破.然而,目前仍然缺乏对现有方法和最新趋势的全面调研.为了填补这个空白,该文全面调研了 ToDNLG的最新进展和前沿领域,包括:(1)系统性回顾:回顾和总结了 ToDNLG近10年的发展脉络和方法,包括非神经网络时代和基于深度学习的ToDNLG工作;(2)前沿与挑战:总结了复杂ToDNLG等一些新兴领域及其相应的