基于二元组合文法的语义知识库构建

被引量 : 0次 | 上传用户:kkkhorse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析一直是自然语言处理领域的热点。从上世纪80年代以来,句法分析的处理的重心逐渐转移到语义处理上来,词一级语言单位的研究又是语义处理的重心。无论做机器翻译、信息抽取还是词汇语义消歧,语义知识是所有这些应用不可或缺的基础性资源。文中首先介绍了本文和整个系统所基于的二元组合文法体系,然后给出了整个句法分析系统的整体架构。在句法分析过程中,句法、语义分析相互交互,语义知识库是语义分析和语义消歧的知识来源。在随后的章节中介绍了主要的语义学设计理论和当前有代表性的语义知识词典。语义学理论是语义知识库设计的理论基础。语义知识词典的描述体系涉及多方面的内容,既有层级分类关系,又有同义、同类关系。但是,总的来说,都还不能直接满足中文信息处理的应用需求,但可以成为本语义知识库的学习资源。从句法分析实际需求出发,我们设计了语义知识库的描述体系和组织结构。语义知识库由词库、语义搭配属性库、层次库、类属库和语义库维护子系统组成。词库在整个语义库的中心,语义搭配属性库存储词与词之间的二元语义搭配属性关系,类属关系库描述的是词语在某分类系统中的相对关系,组成关系库描述的则是词语之间整体与部分的关系。语义维护子系统负责维护语义知识库,提供检索、添加、删除语义知识的接口。然后讨论了向语义库中添加语义知识的方法。首先介绍了哈工大的依存树库,证明了可以将依存树转换为二元组合树,借鉴基于统计的搭配识别算法,采用搭配属性类别加统计的方法直接从依存树库中抽取搭配属性知识,比单独使用统计的方法提高了准确性和召回率,迅速的扩大了语义搭配属性库的规模。对于层次库和类属库,以知网和WordNet为知识源,主要利用人工发现和判断的方法,这样是为了保证层次不产生混乱,然后借助模式识别层次知识的方法,从文本中自动抽取层次知识。这样就构建了一个初步能够满足基于语义的句法分析需求的语义知识库。语义知识库的构建工程量大,难度很高,目前还只能在有限目标下开展工作。但是我们已经找到了一条可行的技术路径,为实现句法分析系统提供了基础资源。该语义知识库还可以为其它中文信息处理的应用提供基础资源,应用前景十分广阔。
其他文献
城市商业空间属于城市功能区的一部分,与城市的发展和居民的生活密切相关。随着城市空间的扩展、产业结构的调整和社会空间的重组,城市商业空间相应发生着改变。在城市化进程
目的提高对类风湿关节炎的认识,以便有进行针对性的行之有效的治疗。方法回顾性总结近两年我院224例类风湿关节炎病例的临床特点,分析关节损害、肺损害,合并干燥综合征等临床
客户关系管理CRM是“以客户为中心”的管理思想和现代计算机技术相结合的产物,它可以帮助企业提升市场竞争能力,建立长期优质的客户关系,不断挖掘新的销售机会,帮助企业规避
朱德青年时代在云南活动,曾有两位恩师,一位是蔡锷(1882- 1916),湖南人,著名军事家、爱国主义者,一位是李根源(1879- 1965),云南人,著名政治家、爱国民主人士。朱德得到了两位恩师的帮助和教育,为后来朱德的
金属注射成形是一种新型的粉末冶金近净成形技术,采用注射成形技术制备不锈钢与传统的精密铸造和粉末压制方法相比具有多方面的优势,应用领域非常广阔。但不锈钢尤其是高碳不
随着社会主义市场经济不断发展,我国现代化建设取得了令人瞩目的伟大成就。与此相适应,我国财政体制也发生了深刻变化。我国的财政体制经历了由封建社会的国王财政,到计划经
糖尿病是由遗传和环境因素相互作用而引起的一组代谢异常综合症.因胰岛B细胞破坏,胰岛B细胞功能缺陷,胰岛素分泌绝对不足或相对不足,胰岛素抵抗等引起碳水化合物,蛋白质,脂肪
<正>一、犯罪学上的累犯与刑法学上的累犯累犯的概念多种多样。它可以由各国法律的不同规定而有所不同,也可以因不同学科从不同角度进行解释而有所不同。各国的法律规定繁纷
<正>黎明,骤响的军号声,划破了洪江古商城郊外的浓雾。立时,演兵场上的喊杀声、坦克装甲车马达的吼鸣、大炮炮弹的爆炸声,在火光中交织成一片,直震得晨星殒落,宿鸟惊飞。在这
随着社会经济的飞速发展,企业面对的竞争日益激烈。企业加强各种因素的管理,为的是提高企业自身的应变能力和竞争实力。在企业的各项因素中,企业文档越来越被人们重视,企业文