论文部分内容阅读
数量名短语的自动识别是中文信息处理中短语识别的重要内容,对汉语深层次句法分析和语义分析将起到很重要的作用。本文对"数.量.名"、量词重叠的数量名短语进行自动识别,以量名搭配概率为基础,提出了基于变长后缀匹配的后退算法来发现更多的量名搭配,把召回率提高了40个百分点。我们在240万字的当代新闻小说语料上进行了识别试验和测试,结果显示,达到80%左右的调和平均值。