【摘 要】
:
自然语言处理是人工智能和语言学领域的分支学科。在这个领域中探讨如何处理及运用自然语言实现特定的应用。本文提出了一种实现自然语言处理应用的方法,称为面向应用的受限
论文部分内容阅读
自然语言处理是人工智能和语言学领域的分支学科。在这个领域中探讨如何处理及运用自然语言实现特定的应用。本文提出了一种实现自然语言处理应用的方法,称为面向应用的受限文法模型实现方法,该模型通过分析问题来形式化地定义一些语言单位,并描述利用语言单位实例实现目标应用的方法,然后通过建立语言单位的受限文法模型快速获取语言单位实例来实现应用。这包括两种情况:一种是应用所处理的语言对象本身是复杂的,如文本语言、对话语言。但可基于某些假设从中定义语言单位及建立受限文法模型,然后通过实验对这些假设进行验证。另一种情况是应用所处理的语言对象本身是简单的,易于建立所需语言单位的受限文法模型,例如机构名称、机构地址。企业经营范围描述企业从事经营活动的业务范围,这些业务范围是进行企业经济行业划分的依据。从语言结构上来看,这些描述是比较简单的,本文利用所提出的方法实现了一个中文企业经营范围自动分类系统。最后,针对经营范围字段中大量出现的术语,本文提出了一种多语种术语自动获取的方法,该方法利用维基百科建立一个以英语为主语种的多语种术语词典。
其他文献
目前越来越多的企业采用基于WEB模式的系统作为企业信息发布、交换、管理、交易的平台。但随着电子商务的发展,B/S结构的WEB系统在用户界面与服务器交互方面的不足逐渐体现了
软件测试作为软件工程的一个重要组成部分,备受研究学者的关注。然而软件测试的花费是极其庞大的,至少50%的软件开发成本用于软件测试,回归测试作为软件测试的一个重要环节,
在网络研究领域,模拟技术已经成为在各种条件下研究网络运行状况和性能的重要方法。但是复杂的大规模网络模拟会消耗大量的计算机资源,甚至规模过大的模拟任务根本无法在一台
近几年里,软件外包已经成为世界软件产业发展的一个重要趋势。越来越多的企业寻求外包软件开发商,当面对越来越多的市场外包软件开发商需求时,对软件外包服务的质量评价的需求也
近年来,随着微博的快速发展,微博数据成倍增长,如何利用这些海量的数据,挖掘有用的信息,成为了研究热点。其中,微博情感分类是一个比较热门的研究方向,它在分析与预测时事走
随着计算机处理能力的提高以及统计机器学习等理论的发展,浅层语义分析逐渐被研究人员所重视。语义角色标注是浅层语义分析的一种实现方式,其具有问题定义清晰,便于人工标注
现今是一个信息爆炸的时代,互联网的应用正迅速渗透到人们日常生活的方方面面。但是与此同时,源于网络的各种攻击破坏行为,对我们生产生活、政治经济产生的危害也日益突显出来。
随着网络通信与计算机技术的飞速发展,WEB服务的种类也逐渐多样化。传统的WEB技术由于互动性和实时性的缺陷,已经无法满足现实的需要。在传统的WEB服务中,所有的用户请求都交给
编队节点在高速运动状态下,有可能由于受到通信条件的制约或节点意外失效,从而失去与原指挥系统的联络关系。在这种条件下,为了保证节点之间通信畅通,必须在各编队节点间采用