基于参数概念表达动词语义

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:mesnower
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的研究和应用的深入,人工智能技术已经逐渐成为人们生活中不可或缺的一部分。作为人工智能技术的一部分,自然语言理解技术是计算机理解人类语言的重要技术,而要理解人类的语言最为困难的地方就是理解人类语言的语义。理解动词对于理解句子的句法和语法都起着中心性的作用。要理解句子的语义有很多种方法。分布假设表明可以用一个词语的上下文信息来表示这个词语的语义,例如这个词语周围的词。近年来应用非常多的Word2Vec技术就是应用了分布假设的性质,但是Word2Vec只是应用了词的线性上下文关系,这些仅是浅层次的语义,所以需要另寻解法来获得更加深层次的语义。显而易见,一个动词在句子中有其独特的角色,因为它包含了与其主语和宾语的依存关系,所以可以用这个动词的主语和宾语来表达这个动词的语义。类似的系统包括ReVerb,采用了“词袋模型”的方法,但这种模型有如下缺点:1)无法考虑同义词的关系;2)“词袋模型”维度很高,因此计算效率低下;3)生成的模型是人类不可读的。为了弥补这些缺陷,一个很自然的方法就是使用这些主语和宾语的抽象概念或类型来表示动词,而不是直接使用这些词。类似的系统包括FrameNet,它通过人类标注动词的主语和宾语类型来表达这个动词的语义。但是,这个系统也有一些明显的缺陷:1)人工标注工作量巨大,无法进行拓展;2)动词参数的抽象程度太高,例如动词“eat”的宾语概念只有“Ingestibles”,所以无法表达动词的多种语义。针对现有技术中的缺陷,本研究工作的目的是提供一种基于参数概念表达动词语义的方法及系统。与现有技术研究相比,本工作期望具有如下的效果:1)提出了一种基于参数概念表达动词语义的方法,创造性地利用外部的知识库来表示动词的语义,并且提供给用户选择动词语义粒度的参数,使得得到的动词语义概念的大小适中;2)基于参数概念表达动词语义的方法得到的动词语义概念即可被人类读懂的,也可以被机器直接进行计算。为此,本文定义了“参数概念化”的问题:给定某一个动词的同一种类的参数实例集合(主语或宾语),而我们想要从外部的概念-实体知识库中抽取k个概念,使得这k个概念在“isA”的关系下能尽可能多的覆盖上面的参数集合。与此同时,我们希望抽取出来的这k个概念之间的“语义重合度”越小越好。从“参数概念化”这个问题出发,本文定义了“概念图”模型,并将问题转化成了“在带权图中找到权值的和的最大的k团”这一形式化的算法问题。并且证明了该问题是NP-Complete问题,最后提出了高效的搜索算法进行求解。经过人工评审,本文算法表现出优秀的效果,这也证实了我们提出的算法推断出来的参数概念的有效性。同时在对比试验中,通过评估三个客观的自然语言处理任务——动词参数识别、动词聚类和词语相似度计算,可以从对比结果中看出,本文提出的算法得到的参数概念结果相比于对比方法取得了全面的提升。
其他文献
曲轴作为发动机的核心构件,其扭振会影响曲轴的使用寿命。因此,需使用曲轴扭振减振器来对扭振进行消减,以此耗散扭振能量。而硅油减振器则是一种典型的无弹性阻尼减振器,被广泛的应用于车用柴油机和船用柴油机上。然而,当前广泛使用的硅油扭振器的阻尼系数固定,属于定阻尼式的扭振减振器,无法根据实时响应需求对器件关键阻尼参数进行自适应调节,使之实现最佳减振控制效果。而磁流变液材料具备响应速度快、连续可调,能耗低等
局域无线双向时间同步系统具有精度高、设备简单以及布置灵活等优点,在许多重要领域都有迫切的应用需求和前景。例如,现代军事靶场,无线传感器网络中都需要点对点甚至分布式的无线时间同步技术。因此研究局域分布式系统间的时间同步具有非常重要的意义。捕获是无线时间同步系统接收端基带对信号处理的首要步骤,捕获性能的好坏直接影响跟踪的速度和伪距解算的精度,从而决定了系统时间同步的精度。论文在并行码相位捕获算法的基础
分布式光纤传感器以光纤作为传感元件与传感信号传输媒质,能够实现远距离、大范围的传感,在缺乏通信、电力等复杂环境下也能以低成本实现高质量的传感,具有其它传感器不可替代的优势。但由于检测距离长、激光器光源噪声、外界环境干扰问题,分布式光纤传感信号伴随着大量非入侵的信号,导致系统虚警率高,因此分离出传感信号中的入侵信号是系统关键之一,有效的入侵信号提取算法,能够精准快速的从伴随非入侵信号的传感信号中分离
自软件测试诞生以来,手动测试一直都占据着测试的主导地位。然而,软件产品的日益复杂性,庞大而重复性的输入输出数据,给手动测试带来了巨大的挑战和困难。自动化测试的引入,
高新技术产业的迅速发展引发了智能材料的不断涌现,压电材料具有灵敏度高、独特的力电耦合等优良特性,作为智能结构和器件的核心材料,被广泛应用于航空航天、机械工程、土木
为获得承载力参数进行桩基设计,援赞比亚国际会议中心项目进行了2根试验桩的静载试验。采用资源需求少的自平衡法进行了现场测试。结果表明,对于侧阻,中国规范给出的经验值与
在微观光学中,周期结构衍射问题的研究具有重要地位,通常把周期结构介质称为光栅.衍射光栅作为一种新兴的技术在光束的设计和制造,矫正镜,分流器,传感器等领域中都有广泛的应
稀疏分裂可行问题是指带有稀疏约束的分裂可行问题,在图像重建、压缩感知、信号、理处机器学习等领域有着广泛的应用.近年来,稀疏分裂可行问题得到了越来越多学者的关注,关于此问题的一些理论分析和算法研究也相继提出.但由于变量的稀疏性质,问题直接求解稀疏分裂可行许多传统迭代算法无法.因此设计稀疏分裂可行问题的有效算法是比较有意义的研究.全文共分成四章.主要结构安排如下:第一章为绪论,行问题的定义、主要阐述了
声波和电磁波的反散射问题在雷达探测,无损探测和医学成像等许多领域中有着广泛应用.但是,在实际测量中,通常只能测得远场(或者散射场)的强度信息,而很难精确测得其相位信息.
精准施药、减量增效是实现我国农业绿色发展的重要举措之一。随着我国植保作业机械化程度的提高,机具喷雾作业效果的科学评价,对提高植保机械的作业质量、减少农药使用量具有重要的指导作用。目前,利用机器视觉技术对喷雾质量检测是一种技术发展趋势,但是存在对粘连雾滴识别精度不高、分割效果较差,导致的检测精度较低等问题。本文基于机器视觉研制了一套便携、检测精度高、操作简单的雾滴沉积特性检测系统,并对粘连雾滴的识别