基于HowNet义原和Word2vec词向量表示的多特征融合消歧方法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:hnjylwn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前词向量表示低频词质量差,表示的语义信息容易混淆,以及现有的消歧模型对多义词不能准确区分等问题,提出一种基于词向量融合表示的多特征融合消歧方法。该方法将使用知网(HowNet)义原表示的词向量与Word2vec生成的词向量进行融合来补全词的多义信息以及提高低频词的表示质量。首先计算待消歧实体与候选实体的余弦相似度来获得二者的相似度;其次使用聚类算法和知网知识库来获取实体类别特征相似度;然后利用改进的潜在狄利克雷分布(LDA)主题模型来抽取主题关键词以计算实体主题特征相似度,最后通过加权融合以上
其他文献
针对现有的图匹配方法没有考虑到社交背景下的多种约束以及在多约束图匹配中图结构的变化,提出一种多约束图模式匹配方法。为了提高多约束图模式匹配的效率,提出强社交图的概念及一种强社交图的索引结构来索引图的可达性、图模式和上下文背景信息,提出维护强社交图索引的算法INC-SSG和多约束图匹配的增量算法SSG-IncMGPM,当面对强社交图结构的变化时能快速有效地识别多约束图模式匹配结果。通过对五个真实社交
随着互联网技术和共享经济模式的快速发展,作为一种新型的群体计算模式,近年来众包(Crowdsourcing)已经得到了广泛的应用并成为研究热点。针对众包应用的特点,为确保众包任务的完成质量,现有研究从工作者能力评估的角度出发已提出了各种不同的众包任务分配方法。首先介绍了众包的概念和分类,阐述了众包平台的工作流程及其任务特点,并在此基础上总结了现有的工作者能力评估的相关研究工作;然后从基于匹配、基于
针对传统的密码锁存在安全性低、稳定性差等问题,提出一种基于FPGA的密码锁的设计方法,以现场可编程逻辑器件为载体,并采用Verilog HDL硬件描述语言,实现密码锁的解锁、修改密码、报警提示和数码管显示功能。密码锁系统主要由按键输入模块、按键消抖模块、分频模块、密码检测模块、输出控制模块、译码显示模块组成。利用Quartus Ⅱ 13.0和Modelsim 10.4软件对各模块进行综合和仿真验证
柔性作业车间调度问题(FJSP)是一类应用广泛的组合优化问题。针对多目标FJSP求解过程复杂、算法易陷入局部最优的问题,提出了一种基于多区域采样策略的混合粒子群优化算法(HPSO-MRS),以同时优化最大完工时间和总机器延迟时间这两个目标。多区域采样策略能够区分粒子所在Pareto前沿面的位置,根据不同区域进行采样重组,并为采样后位于Pareto前沿面多个区域的粒子规划相应的运动方向,从而有针对性
针对水工隧洞缺陷识别任务中现有深度卷积神经网络(DCNN)对缺陷图像特征提取能力不足、识别种类少、推理耗时长的问题,提出一种基于动态特征蒸馏的缺陷自主识别方法。首先,通过深度曲线估计网络对图像进行优化,从而改善低照度环境下的图像质量;其次,构建加入注意力机制的动态卷积模块取代传统静态卷积,并且把得到的动态特征用于训练教师网络以获得更好的模型特征提取能力;最后,在知识蒸馏框架中融合鉴别器结构,以构造
为提升大坝安全运维的效率,大坝缺陷目标检测模型有助于辅助巡检人员进行缺陷检测。大坝缺陷几何形状多变,而采用传统卷积方式进行特征提取的单点多盒检测器(SSD)模型无法适应缺陷的几何变换。针对上述问题,提出可变形卷积单步多框检测器(DFSSD)模型。首先将原始SSD的主干网络VGG16中的标准卷积替换为可变形卷积,用于处理缺陷的几何变换,并且通过学习卷积偏移量来提升模型的空间信息建模能力;其次针对不同
无线Mesh网络(WMN)由许多网状节点组成,它提供了有效的Internet链接。接入认证安全是WMN快速普及的主要障碍,故提出一种基于区块链的无线Mesh网络认证机制。验证过程只需要比较用户提供的证书计算的哈希值是否与存储在区块链中的哈希值一致,与已有认证机制相比简化了认证流程,减少了认证延迟,提升了认证效率,解决了集中式架构容易导致的单点故障问题,达到分布式认证效果,区块链技术的引入为解决无线
大规模数据分析环境中,经常存在一些持续时间较短、并行度较大的任务。如何调度这些低延迟要求的并发作业是目前研究的一个热点。现有的一些集群资源管理框架中,集中式调度器由于主节点的瓶颈无法达到低延迟的要求,而一些分布式调度器虽然达成了低延迟的任务调度,但在最优资源分配以及资源分配冲突方面存在一定的不足。从大规模实时作业的需求出发,设计和实现了一个分布式的集群资源调度框架,以满足大规模数据处理的低延迟要求
针对功能磁共振成像(f MRI)数据的高维度小样本问题,提出谱聚类半监督特征选择(SS-FSSC)模型。首先利用先验脑区模板提取时间序列信号;然后选取皮尔逊相关系数与序统计量相关系数(OSCC)描述脑区间的功能连接特征,并对特征进行谱聚类;最后利用基于Constraint得分的特征重要性准则挑选出特征子集,并把这些子集输入支持向量机(SVM)分类器进行分类。实验通过在COBRE精神分裂症公开数据集
变化检测作为土地利用/土地覆盖检测的关键技术,其目的是在同一区域不同时期的遥感数据中检测出变化的部分及其类型。针对传统的变化检测方法中存在繁重的人工劳动和检测结果效果差等问题,大量基于遥感影像的变化检测方法被提出。为了深入了解基于遥感影像的变化检测技术以及进一步研究变化检测方法,通过对大量有关变化检测的研究进行整理、分析和比较,对变化检测进行了较为全面的综述。首先阐述了变化检测的发展历程;然后从数