一种带权值参数的非监督式形态切分方法

被引量 : 0次 | 上传用户:wzs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以两种黏着语维吾尔语和蒙古语为研究对象,介绍了基于最大后验概率模型非监督式形态切分方法。该模型是以最小描述长度原理为基础,视形态丰富的语言为词素编码的文本序列。形态切分实质则是由蒙古语的文本序列找到一个词素集合,且要求该集合能够高效的对形态丰富文本语料进行编码。然而最大后验概率模型无法根据特定的语言进行调整,鉴于此本文提出在最大后验概率的基础上加入权值参数,并采用少量人工切分的语料进行参数调整的方法。实验显示,最大后验概率模型可以较好的对维吾尔语和蒙古语进行形态切分,加入权重参数后,模型能更好够适特定的语言,使切分准确率、召回率和F值均有了进一步的提高。
其他文献
介绍了抓斗式卸船机负载特点,分析了宝钢6号卸船机电气传动与控制系统的系统结构和控制功能,论述了抓斗控制系统的工作原理,主传动控制系统采用交流变频矢量调速,通过负荷平衡和
著名学前教育家陈鹤琴先生说:"大自然是我们的知识宝库,大社会是我们的生活宝库,是我们的活教材。"秉承这一教育理念,根据新《纲要》的精神要求,结合幼儿园种植课程的开展,我
《献给艾米丽的玫瑰》出版于1931年4月30日,它也是福克纳在国家杂志上首次出版短篇小说。福克纳表示这篇小说中没有多余的语言(there is no trashin"a rose for Emily"),短篇小说
本文主要分析了国际酒店在我国的发展现状以及未来一段时间内的发展趋势,同时讨论了如何让国际酒店管理集团在我国进一步发展并找出相对应的策略。
期刊
<正>杭州中山中路步行街是到杭州的旅客必去的地方。一千年前,此地曾是南宋京城临安御街最繁华的商业街区。在这短短千米距离的商业繁华地带,开设有上百家非常特殊的店铺——
介绍AT89C52单片机的自适应模糊PID温度控制器的设计在常化炉控制中的应用,主要阐述了模糊控制器的工作原理、自适应模糊控制系统结构、设计原则,讲述了模糊控制参数获得的方
提出了一种新的永磁同步电机直接转矩控制方法。永磁同步电机直接转矩控制中,没有任何一个逆变器开关矢量能够产生恰好的定子电压,使该电压可以产生所期望的转矩和磁通变化,因而
通过对水泥浆体干缩、电阻率和强度性能的分析,研究了减缩剂对化学外加剂作用下水泥浆体结构形成与发展的影响。结果表明:从减缩的角度来看,减缩剂与减水剂的相容性较好,且基