一种基于N元语法分布的语言模型自适应方法

来源 :北京航空航天大学学报 | 被引量 : 0次 | 上传用户:yxjisg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
N元语法分布能恰当地描述语料库的特性,为了有效利用普通领域训练数据,提出一种基于N元语法分布的语言模型自适应方法.该方法定义一个小的领域内的高质量种子集和一个大的普通领域的质量不稳定的训练集,将训练集的N元语法分布自适应到和种子集的N元语法分布相似,以更好地进行特定领域单词识别.实验结果表明,基于N元语法分布的语言模型自适应方法可以使单词困惑度和词错误率分别比传统的简单插值法降低11.1%和6.9%.
其他文献
针对低滞后刷式密封物理结构,应用计入刷丝变形影响的各向异性多孔介质模型,用阻抗力表示刷丝对流动介质的阻碍作用,并将其作为Navier-Stoke方程的源项,以有限体积法和SIMPLE算法
总结了目前医疗机器人灵活性的分析方法,基于服务球的数值法,对5R串联机器人和4H并联机器人进行了灵活度计算,得到了各自的任务灵活度.针对9-DOF冗余度串并混联医疗机器人运动学