融合形态特征的最大熵维吾尔语词性标注

来源 :西北大学学报:自然科学版 | 被引量 : 0次 | 上传用户:hhhanyin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据维吾尔语黏着型的特点,以及形态化单词和频率进行统计分析之后的结果,为解决因单词形态而导致的数据稀疏问题和兼类词标注的问题,提出了维吾尔文的融合词干、词缀等形态特征的基于最大熵的词性标注模型。在通用的词性标注模型的基础上,构造了相应的词性标注特征模版,并设计了它的特征函数。实验结果分析表明,最大熵模型可以较好地处理维吾尔文词性标注的问题,其中词缀特征对提高兼类词和未登录词的词性标注有着十分显著的效果,与其他只用词形的词性标注系统相比准确率比以前提高了2.64%,达到了96.85%。
其他文献
缔合高分子型原油管输减阻剂因其兼具较好的减阻与抗剪切性,而受到人们的广泛关注。简要概述缔合高分子型原油管输减阻剂的发展现状,总结分析比较了该种减阻剂合成方法,详细阐述
阴火是李东垣脾胃论学术思想的重要部分,自60年代起,已成为许多学者的研究对象,并累积了相当多的研究成果。但大多数的研究都是探讨阴火与脾胃气虚及甘温除热的关系。笔者把
中国樱桃(Cerasus pseudocerasus Lindl.)是我国古老的具有较高经济价值的栽培果树之一,个别性状突出的野生中国樱桃是对现有栽培品种进行遗传改良的重要资源。四川野生中国
日前,由国家自然科学基金委员会资助、西北大学主办的第五届全球华人化工学者研讨会(The5thGlobalChineseChemicalEngineersSymposium)在陕西宾馆成功举行。来自加拿大、英国、
目的让人们充分认识到国产固定电阻器的温度特性曲线问题的严重性。方法通过对1000个的不同时期固定电阻器的温度特性曲线的统计分析,讨论了国产固定电阻器关于温度特性曲线的
叙述了系统的开发制作过程.主要使用了Dreamweaver、Flash、Fireworks和Photoshop等软件,利用可视化网页编辑软件Dreamweaver制作网页,采用了层、CSS、Javascript等多种技术
建立测定青荚叶中木犀草素、肉桂酸含量的HPLC测定方法。采用反相高效液相色谱法(RP-HPLC),色谱柱为Thermo C18柱(250 mm×4.6 mm,5μm),测定木犀草素:流动相为甲醇∶0.2%磷酸
目的在随机设计条件下,提出了一类变系数联立模型,对模型的变系数进行了估计,研究了估计量的大样本性质。方法局部线性广义矩估计。结果利用概率论中大数定律和中心极限定理,
目的:观察葛根芩连汤合归脾汤治疗慢性溃疡性结肠炎的临床疗效。方法:将70例患者随机分为对照组和治疗组,每组各35例。治疗组采用葛根芩连汤合归脾汤加减治疗,对照组采用柳氮
目的:探讨葛根芩连汤口服加康复新液保留灌肠治疗30例溃疡性结肠炎临床疗效。方法:回顾分析2013年9月-2016年9月我院收治的63例溃疡性结肠炎患者的临床资料,根据治疗方式不同