论文部分内容阅读
当今语音识别技术迅猛发展,已经开始在许多领域进行应用,但依然存在许多问题。首先,由于背景噪音、说话人口音和表达方式的不规范以及新词的不断出现,实际环境中语音识别的正确率一直不尽如人意。而且,语音文档检索开始大规模应用,有许多语音识别后文本需要进行大规模处理。因此,我们采取对语音识别后的结果进行后处理,以此改善语音识别效果。本篇论文主要基于教育部科学技术研究重点项目“语音识别结果的鲁棒性理解方法关键技术研究”,该项目旨在通过对语音识别结果进行分析,得到更加正确,完整的语音识别结果。在此项目研究背景下,本文在完成一个完整的语音识别后文本处理系统中对文本语音信息评价算法进行了深入研究。本文的主要研究内容和工作有:1.拼音语法知识库的搭建。对拼音N-gram模型与数据平滑介绍和对比分析,得到更加合适中文拼音的语法模型与数据平滑方法,并介绍如何搭建使用不同语法模型和平滑方法的拼音知识库。2.语音识别结果锚点词的定位。对连续拼音N-gram模型进行分析和评价,总结相应规律,辅助应用拼音稳定度,最后得到锚点词的确定方法。3.纠错候选建议。该部分在介绍拼音混淆规则后得到相应的相似拼音并转换成对应候选词。为了对候选词进行打分,使用拼音相似度来衡量与原拼音的接近程度。4.应用算法至实际系统。将上述算法实际应用到一个完整的语音识别检错纠错系统中,介绍其系统框架与具体实现,解释本文工作在其中发挥的作用,对比分析实际应用效果。