论文部分内容阅读
本文针对广播新闻语料声学环境复杂多变的特点,构建了完整的广播新闻语料识别系统一ThinkIT-BNR系统.该系统包括:音频匹配、音频自动分段、音频分类、说话人聚类、识别后处理,以及多阶段识别策略等多个模块.本文还通过半自动标注方法,建立了70小时的广播新闻语料库.对新闻联播节目的测试表明,ThinkIT-BNR系统的误识率仅为10.14%.