论文部分内容阅读
随着人机通信研究的不断深入,语音合成技术越来越受到各国学者们的关注。语音合成系统要想提高其合成的语音的自然度,关键的第一步就是汉语自动分词问题。汉语自动分词是中文信息处理中的重要课题,国内外的许多学者在自动分词领域进行了富有成效的工作,但是,在提高分词精度的问题上仍然存在着很大的困难。汉语自动分词,首先必须就影响汉语分词精度的语言现象做针对性的研究,从本质上把握问题;其次,就是对分词算法进行有效的设计改进,提高其分词能力;最后要对分词过程中的信息和分词后的处理进行深入的研究。本文对自动分词问题做了全面的分析研究,分析比较了当前主流分词算法的特点,介绍了目前比较成熟的几个分词系统,详细阐述了自动分词问题的难点之— —歧义切分的起源和处理方法;最后详细说明了根据语音输出的实际需要设计的分词系统的分词词典以及自动分词系统的具体设计和实现。实验表明,所实现的系统在分词的准确率和歧义切分等方面了都获得了较好的结果。