基于图的多源数据融合框架研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:elrshay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在给定的任务中分析各种数据时,目前大多数研究只针对单源数据进行分析,缺乏应用于多源数据的方法.但如今数据日益丰富,因此提出一种多源数据融合框架,用于融合多种网络平台数据.同一平台数据中包含文本与各种属性,同时不同平台的数据在内容与形式方面也存在很大差异.然而现有的网络信息挖掘方法大多仅使用同一平台中的部分数据进行分析,忽略了不同平台的数据之间存在的相互作用.因此文中提出一种数据融合框架,一方面,能基于图的强大表示能力融合同一平台不同类型的特征,从而提升单个平台的任务性能;另一方面能够利用不同平台的数据特征,使其相互补充,从而提升多个平台的任务性能.文中讨论的融合数据类型包括文本、时间、作者信息,这些特征涉及连续特征、离散特征以及非结构化特征.所提框架在事件分类任务上提升了 F1值,验证了提出的多源数据框架的有效性.
其他文献
针对实用型拜占庭(PBFT)共识算法中存在的可拓展性较差、主节点选取随意、网络开销较大等问题,文中面向联盟链设计并提出了 一种优化的实用型拜占庭共识算法.首先,为集群中的节点设置不同的角色,根据不同角色为节点分配不同的权限,不同权限的节点设计了动态进出网络机制.其次,在生产节点选举时,设计了投票机制与基于信誉度的FTS树相结合的选举算法,保证了选举的安全性和公平性.最后,在共识流程方面优化了 PBFT共识流程,缩减了 PBFT共识中的网络开销.实验结果表明,提出的POC共识算法相较于PBFT算法,具有高动
推荐系统缓解了互联网数据量剧增带来的信息过载问题,但传统的推荐系统由于数据稀疏和冷启动等问题导致推荐算法的准确性不高.因此,文中提出了一种基于知识图谱和标签感知的推荐算法(Knowledge Graph and Tag-Aware,KGTA).首先,利用项目和用户标签信息,通过知识图谱表示学习捕获低阶与高阶特征,将两个知识图谱中实体和关系的语义信息嵌入低维的向量空间中,从而获得项目和用户的统一表示.其次,分别利用深度神经网络和加入注意力机制的递归神经网络来提取项目和用户的潜在特征.最后,根据潜在特征预测评