基于SVM的离合词词义消歧

来源 :河北大学 | 被引量 : 0次 | 上传用户:chiaotian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离合词词义消歧对汉英机器翻译、信息检索、语音识别、文本分类等众多领域有着重要的影响。本文以北京大学中国语言学研究中心的现代汉语语料库为基础,研究具有两个词义且其词性相同的离合词的词义消歧问题。首先,针对扩展形式的离合词和非扩展形式的离合词,分别设计相应的特征模板,根据特征模板提取上下文特征;然后,通过考虑不同类型的特征对离合词词义消歧效果的影响不同,提出了一种基于特征类型重要性的特征加权方法。该方法针对一种类型特征权重,分别改变另外两种类型特征权重的消歧正确率来验证三类特征的消歧效果,对不同权重下的离合词词义消歧效果进行了考察;最后,设计了基于SVM的离合词词义消歧分类模型。在建立SVM分类器时,利用遗传算法对SVM的惩罚因子C和核函数参数γ进行优化,把十折交叉验证得到的离合词词义消歧正确率作为适应度函数。实验结果表明,使用遗传算法优化SVM参数后的分类器时,基于特征类型重要性的特征加权方法的消歧效果优于布尔函数加权方法、基于词频的特征加权方法、TF-IDF加权方法。
其他文献
业务过程管理技术集成已有信息资源支持组织内和协作组织之间业务过程的信息化管理。随着IT技术的发展,业务过程管理已经成为提高组织竞争力的关键技术。由于具有平台独立性,
由于通用搜索很难满足个性化和专业化的需求,垂直搜索应运而生。垂直搜索能提供给人们更相关的信息。本文对中文垂直搜索中的几个关键技术进行论述,并设计实现了一个简单的检
学位
数学公式格式转换是数学公式检索系统中的重要组成部分,而歧义公式转换的正确与否,会直接影响检索系统的查准率。实现歧义公式的转换,有利于为用户提供更准确的检索结果。数
由于系统复杂性、异构性、动态性日益提高,以及外在攻击手段的不断革新,关键任务系统的管理与维护日益困难,操作失误频繁发生,致使系统时刻面临使命中断、软件故障,甚至是崩
现代化市政建设对城市照明系统的要求不断提高。传统的路灯控制与维护手段存在着诸多的缺点和弊端,已经远远无法适应城市现代化发展的需求。   ZigBee技术是近年来逐渐兴
随着计算机软件应用的不断发展,人们对软件的安全性和可靠性的要求越来越高,如何在软件开发过程中保证其安全性成为了软件工程所要研究的重点问题。本文考虑软件需求分析阶段
随着计算和通信技术的快速发展,很多计算机应用系统已广泛普及,比如云计算、无线传感器网络、掌上电脑、移动电话和智能卡。由于网络的开放性,信息安全问题逐渐成为这些系统应用
RFID(Radio Frenquency Identification)技术,即无线射频识别技术,是采用无线射频方式进行非接触通讯,自动识别物品并获取数据的一种快速识别技术,已在各个领域得到广泛应用,
合成孔径雷达(Synthetic Aperture Radar,SAR)是微波成像系统,不受天气、地理和时间等因素的限制,可对地球表面进行高分辨率成像,并且能透过植被发现隐蔽的地下目标,提供丰富