分词歧义相关论文
随着信息技术的迅速发展和互联网规模的不断扩大,互联网已经成为了全球最大、应用最广泛的信息库,如何有效检索这些海量信息成为当前......
针对基础词更能表达中文文本所包含的基本信息,更适合于后续的文本挖掘,提出一种基于N-gram的双向匹配中文分词方法.充分挖掘训练......
本文以2000年的人民日报为研究载体,共计24,181,518字,根据不同考察目的逐条分析标注,统计,得出数据,找出规律。本文先研究连词“而”识别......
摘要:本文旨在提供一种基于非监督训练的分词歧义解决方案和一种分词算法。基于EM的思想,每个句子所对应的所有(或一定范围内)的分词......
中文分词是计算机翻译和搜索引擎技术等的一个瓶颈,目前国内外对汉语分词的研究仍远不如人意,本文对汉语分词歧义做了探讨和分析,......
近几年的中文分词研究中,基于条件随机场(CRF)模型的中文分词方法得到了广泛的关注。但是这种分词方法在处理歧义切分方面存在一定的......
针对受限领域的特点及现有分词面临的困难,比较现有分词的方法,选择并改进了最大分词算法,设计了一个基于受限领域的中文分词系统,......
中文自然语言处理中专业领域分词的难度远远高于通用领域。特别是在专业领域的分词歧义方面,一直没有找到有效的解决方法。针对该......
本文引用各种例子,对汉语分词歧义类型进行分析,论述了汉语行文语法改革的必要性和改革方法,然后对汉语语法改革后的中文信息处理......
句法分析是自然语言处理过程中一项基础性的工作,从二十世纪四十年代末到现在,国内外学者们设计了很多自然语言处理的形式模型,这......
近几年随着自然语言处理应用的发展,专业领域中文分词的需求越来越大。由于专业领域语料资源较少,很多实验无法进行。大部分中文分词......
本文以面向信息处理为目的,对介词“向”及其结构进行研究,主要是对“向”的自动分词,介词短语“向X”的边界识别作一定的研究,希......