灵活语序的汉语言陈述句逻辑算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:skyfis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据的到来,以及互联网的迅速发展,自然语言处理中的信息处理中扮演着重要角色。我们日常生活中很多事情都离不开自然语言处理,如机器翻译、智能应答、语义搜索等。目前,自然语言处理已经从句法、词法层面走向轻量级语义层面。针对汉语陈述句的自然语言处理,传统的自然语言处理一般采用基于概率模型的统计方法和语义逻辑方法。但基于概率统计的方法无法实现自然语言的语义处理,而过于强调语义的逻辑方法又使得计算复杂性大大增加。对于传统基于逻辑的方法,自然语言处理一般采用Lambek演算。但是,由于Lambek演算缺少了收缩、弱化和交换律这三条结构规则,因此无法解决汉语陈述句灵活语序的处理问题。对于Lambek演算不能处理灵活与许的问题,现有的方法,如加入模态词、新连接词等,但又因其进一步增加了本已是NP-hard的Lambek演算的复杂度,因此这些方法不适合计算机的处理。因此,现时代迫切需要一种新的方法,使得计算机能够很好、快速地处理这些问题。基于此,本文提出了加标动词匹配的Lambek演算,通过对Lambek演算中的句法类型进行标记(预处理),从而使之能对灵活语序的汉语陈述句进行处理。加标动词匹配的Lambek演算的目的是通过移动规则来对句法类型序列进行调整,使得类型序列的顺序能够正常通过Lambek演算。加标动词匹配算法的时间复杂度低,将其用于Lambek演算中并不会改变其复杂性,因此使得计算机及其程序能够有效的对汉语陈述句中的灵活语序问题进行处理。此外,Lambek演算在自然语言处理有着许多优点,它不仅是上下文无关的、具有代数语义和关系语义的模型,而且还能通过Curry-Howard对应理论与λ-演算引入轻量级语义处理。λ-演算是用于数学定义、函数应用和递归的形式系统,λ-演算可以对自然语言处理中的语义模型进行描述。因此,本文又提出了λ-Lambek演算,通过λ-Lambek演算对灵活语序的汉语陈述句进行处理,同时对其进行了轻量级语义的研究,并建立了语义二叉树模型。通过加标动词匹配的Lambek演算,实现了对汉语陈句中灵活语序问题的处理,然后通过λ-Lambek演算对汉语陈述句及其灵活语序进行了轻量级语义的研究。此外,通过程序实验验证了这两个方法的有效性,这对汉语陈述句及其灵活语序等自然语言的处理有着重要作用。
其他文献
随着计算机网络技术的飞速发展,Internet已经渗透到社会生活的各个方面,并发挥着越来越重要的作用。网络的发展呈现如下特点:第一,网络规模进一步扩大,复杂性提高,各种应用也越来越
GML是开放式地理信息系统协会OGC(Open Geospatial Consortium)制定的、基于XML的地理信息编码规范,它中立于任何厂商、任何平台,为地理信息包括地理要素的空间与非空间特性
奈奎斯特采样定理要求采样频率不得低于信号最高频率的2倍,这会导致海量的采样数据,也给信号处理带来极大的挑战。压缩感知(Compressive Sensing,CS)理论应运而生。该理论能
随着技术的不断发展以及企业信息化进程的不断前进,造成了各种各样应用系统共存的现状因为历史的原因,应用系统当初只是被用来解决专门的业务问题,在设计之初没有考虑系统扩展的
随着网络的普及,P2P技术在很多领域得到应用,在P2P网络环境下引入电子商务,可以避免单点失效问题,节约成本,增加商务活动的方便性和灵活性,但另一方面也加大了商务活动中的风险性和
计算机技术、多媒体技术以及Internet技术的长足发展导致大量图像的出现,如何有效地、快速地从大规模的图像数据库中检索出需要的图像是目前一个相当重要而又富有挑战性的研究
目录服务是重要的网络基础设施之一,很多网络服务如PKI系统、下一代智能化网络管理系统等都需要目录服务来发布和检索目录信息。目录服务通过命名、描述和指定一个企业范围内
矩形毛坯优化排样问题广泛用于机械制造业、家具制造业以及皮革制造业等行业。随着制造行业市场面临的竞争日益激烈,有效提高材料的利用率,降低生产成本,是增加企业效益的有
本文主要应用Petri网工具形式化分析了计算机集群中负载均衡机制,在建立了负载均衡机制模型的基础上,做出了模型的形式化验证和性能分析。作者的工作主要体现在以下三个方面:
网络信息安全问题不仅越来越受到生活在网络信息社会中的所有人的重视,而且它已经涉及到社会生活的方方面面。为了建立安全可靠的信息网络,进行网络安全技术的研究与设计是极其