基于词向量聚类的中文微博产品命名实体识别

来源 :兰州理工大学学报 | 被引量 : 0次 | 上传用户:luo665
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体识别的重要作用.因此,考虑中文微博的特殊性,提出一种融合全局上下文信息的词向量特征选择方法,分别采用主题模型和神经网络词向量聚类两种方法获取深层语义信息,并结合层叠条件随机场进行中文微博的命名实体识别.实验结果表明,基于词向量聚类的中文微博产品命名实体识别方法取得了较好的效果.
其他文献
随着我国经济的逐渐发展,经济与社会开始走入繁荣的阶段.在这种大趋势下慈善事业也就成为当前最为关注的事情.因此本文主要以研究慈善组织中的档案管理为主,重点谈谈慈善组织
汪曾祺是我国20世纪最著名的文学家之一,他以散文和短篇小说见长。他的创作特点是"闲散自由、恬淡自适;崇尚自然,反对雕饰"。在同类作家作品中,汪曾祺作品最具特色的是他的小
摘要:本文以“冰山原理”为立足点,在多模态话语理论之下,对《在密西根北部》的多模态话语进行简要的解读,抽取作品当中具有代表性语言句式以及人物对白作为分析的载体,意在抛砖引玉,求教方家。  关键词:《在密西根北部》 多模态话语 冰山原理  引言  《在密西根北部》是海明威的早期作品,对于该作品,无论是海明威的导师斯泰因先生抑或是部分的文学评论加均不表示认可,认为作品当中所描绘的场景太过香艳,思想内涵
通过计算黄河淡水在渤海内部的水龄变化,能够进一步了解由黄河口排出的溶解性污染物在渤海中的输运时间和分布规律。利用ROMS(Regional Ocean Modeling System)数值模型,加入了
著名作家莎士比亚作为一个时代的传奇,作为戏剧家和诗人的多重创作身份,他还是一个语言大师,其语言风格上的创新对后世文学影响深远。本文从语言的角度探究莎士比亚的语言艺