基于FSVM层叠模型的中文命名实体识别

来源 :第七届中文信息处理国际会议 | 被引量 : 0次 | 上传用户:ldd3663
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文命名实体构成的复杂性,提出了一种基于模糊支持向量机的层叠模型。基于最长次长匹配一体化分词标注结果,在底层利用支持向量机基于单字特征进行人名、简单地名和机构名的识别;在高层回到词的层面,利用支持向量机基于词特征对复杂地名和机构名进行识别。通过基于单字和基于词的模糊支持向量机的结合,实现了对命名实体的一体化识别。模糊支持向量机的引入,降低了噪声样本和异常数据的影响,提高了系统识别精度。
其他文献
高风格高水平从九月十一日到二十八日在首都北京举行的中华人民共和国第二届运动会,取得了巨大的胜利和成功。我国人民的伟大领袖毛泽东主席、刘少奇主席以及党和国家其他领
本文提出了一种新的基于规则的不依赖于分词的数量短语识别方法来实现中文数量短语的识别。首先对中文数量短语识别技术的现状进行了简要分析和概述,明确了中文数量短语识别
会议
副词用法多样,已有的副词研究大都是面向人用的,很难直接用于自然语言处理的实际应用中。本文从副词的实际用法入手,调整和完善了副词用法信息词典,构建了面向机器识别的规则
无线传感器网络因其巨大的应用前景而受到学术界和工业界越来越广泛的重视.简述了无线传感器网络的体系结构,详细介绍了一种基于ATmega128L和2.4GHz无线收发模块CC2420的无线
本文主要描述了意见挖掘中如何判定汉语语句情感词的语义倾向(极性)。我们不仅计算情感词的静态极性,而且通过分析它的上下文,计算情感词的动态(修饰)极性。从而提高了情感描
景德镇陶瓷行业经管类人才的队伍现状不容乐观.表现为平均学历职称水平远低于其它行业、人才流失严重、人才结构严重不合理、高端企业经管人才稀缺等等.集团化、专业化、品牌
长距离回指是回指的一种,其先行语一般在离回指语较远的上文中,从而增加了消解的难度。长距离回指消解一直是自然语言处理中的难题。本文以汉语为个案,旨在探讨长距离回指的
实体关系的抽取是信息抽取中的一个重要问题。针对中文句法分析研究现状,本文首先设计了一种能够直接利用浅层语言特征的混合谱核来描述关系实例的上下文,并给出了基于广义后
会议
树库的构建是语料库语言学的重要组成部分。本文提出构建一种全新的汉语树库-依存图库.依存图表示可以突破以往树结构表示的局限,更好地表示词语之间的关系,对于汉语特殊结构
本文在理论分析的基础上,并通过基准实验验证,提出一种多向量表示模型,该模型在尽量不丢失新闻报道信息的情况下,对特征集合尽可能细的划分,在模型比较时采用支持向量机对多