一种多知识源汉语语言模型的研究与实现

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:guyisun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对汉语语言模型中知识获取不足的问题,提出了一种统计与多种形式规则信息结合的机制,将规则的表示量化,提出语法语义规则矩阵的概念,通过扩充词网格、对基于最大可能性的n元概率值合理调整,将短语构成规则、二元语法语义规则、最少分词原则等融入统计模型框架,构成多知识源语言模型,模型应用于智能拼音汉字转换系统,明显提高了音字转换正确率,并适于处理长距离和递归语言现象.
其他文献
牛津初中英语(译林版)以大量的词汇而让很多学生头疼不已。该文概述了牛津初中英语的特点,并在实践中逐步总结出牛津初中英语词汇记忆的"五步曲",即熟读,互译,语境记忆,慢读
提出了一种新的基于角色的访问控制模型,该模型对典型RBAC模型进行了扩展,在典型RBAC模型只对与访问主体安全相关的概念进行抽象的基础上,增加了对与访问对象和访问事务安全
在理性Agent的形式化中,通常认为Agent的思维状态包含信念、愿望和意图这3个属性. 它们之间的静态关系已被人们充分重视,但它们随时间的动态变化还未被很好研究.考察了意图维