基于词向量的中文微博实体链接方法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:gjj19901005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体链接是指给定实体指称项和它所在的文本,将其链接到给定知识库中的目标实体上。由于微博内容存在特征稀疏、用语不规范的特点,使用传统的方法效果较差,为了准确地对微博中给定的实体进行链接,提出一种基于词向量的中文微博实体链接方法。首先,对知识库进行扩展,并从中文维基百科抽取同义词构建同义词表;然后,利用词向量解决错别字和外来人名音译的问题;最后,通过词向量计算实体指称项和候选实体的语义相似度来进行实体链接。实验结果表明,该方法在NLP&CC2013评测数据上的微平均准确率达到了91.4%。
其他文献
视听语言的发展史经历了一个较长的历史过程.无论是电影也好,电视也好,都极其重视视听语言.但是电影要先于电视,所以视听语言的研究更倾向于电影.两者在视听语言上大致相通,
信号重构是压缩传感领域中的研究方向之一。针对基于l1范数在信号重构中存在不光滑、可导性差等缺点,构造一种基于l1范数平滑渐进函数。并对该函数的单调性和最优解序列收敛性进行证明。在仿真实验中,通过实例验证该算法的有效性。与经典重构算法在重构指标方面进行比较,实验效果证明该算法的重构效果更好,并且误差小、精度高。
信息环境背景下,互联网技术以及信息技术已经被广泛应用到社会各行各业的领域中,和民众的日常生活以及工作紧密结合在一起.图书资料管理行业就是其中之一,在网络信息化背景之
机采棉的含杂量与含水率远大于手摘棉,籽棉纤维品质也略差于手摘棉。由于机采棉的这些缺点,应结合实际,从籽棉采摘源头、籽棉含水率控制、籽棉烘干后加工要求、籽棉加工工艺、棉