【摘 要】
:
随着在线社交网络的普及,越来越多的用户同时具有多个虚拟账号。在这种情况下,跨社交网络识别出用户的多个社交账号对用户信息对齐、个性化服务推荐以及信息融合都具有重要意义。目前,跨社交网络多用户身份识别已经得到了广泛的研究,但现有的工作中还存在以下问题:(1)经典的多用户身份识别算法对用户档案信息关注过多而缺乏融合分析用户个性化行为信息;(2)在多用户账号匹配过程中,缺乏对已匹配的用户账号对进行二次确认
论文部分内容阅读
随着在线社交网络的普及,越来越多的用户同时具有多个虚拟账号。在这种情况下,跨社交网络识别出用户的多个社交账号对用户信息对齐、个性化服务推荐以及信息融合都具有重要意义。目前,跨社交网络多用户身份识别已经得到了广泛的研究,但现有的工作中还存在以下问题:(1)经典的多用户身份识别算法对用户档案信息关注过多而缺乏融合分析用户个性化行为信息;(2)在多用户账号匹配过程中,缺乏对已匹配的用户账号对进行二次确认;(3)目前,用户自身隐私意识的提高导致无法获取大量的用户数据信息且获取代价较高,如何利用少量且具有高访问性的用户信息进行多用户身份识别;(4)针对用户信息权重分配问题,现有的基于主观导向的赋权算法忽略了不同用户信息对多用户身份识别的贡献程度。本文就现有工作中存在的不足,提出了四种针对不用应用场景的多用户身份识别算法,以进一步提高跨社交网络多用户身份识别算法的普适性和精确性,主要贡献如下:1.由于经典的多用户身份识别算法仅依靠用户档案信息而缺乏对用户个性化行为信息的融合,致使这些识别算法在高精确度应用场景中受限。针对此类应用场景,提出了基于个性化行为分析的多用户身份识别算法。对用户档案信息进行预处理,并采用不同的相似度计算方法来测量各项用户信息的相似度。此外,个性化分析用户行为信息,并融合用户档案信息以构成一个多维的相似度向量。同时,采用基于后验概率的权重分配算法来解决用户各项信息之间的权重失衡问题。利用相关的账号匹配算法实现多用户身份识别的目的,与仅基于用户档案信息的识别算法相比,所提算法有效提高了精确率、召回率以及F1。2.由于多用户账号识别过程中缺乏对获取的账号匹配对进行二次确认,致使大部分的识别算法在实际应用场景中识别性能受限。针对此类应用场景,提出了基于稳定婚姻匹配的随机森林二次确认算法。通过对用户各项信息进行相似度计算和赋权,以构建相似度评分公式,并将其与稳定婚姻匹配算法相结合来获取多用户账号的候选匹配对。同时,将获取的用户相似度向量训练集合用于训练随机森林模型,以此对获取的多用户账号候选匹配对进行随机森林二次确认来进一步提高多用户身份识别的性能。3.由于社交网络和用户自身隐私意识的提高,致使一些依靠大量用户信息而进行多用户身份识别的算法普适性较差。针对此类应用场景,提出了基于用户行为习惯的多用户身份识别算法。通过提取用户显示名称所含的特征,分别利用不同的相似度计算方法来计算显示名称所含特征的相似度,并结合变种熵值为提取的特征进行赋权。同时,分析用户的发布内容,测量不同用户兴趣图谱之间的相似度。在多用户账号匹配过程中,针对出现的一对多和多对多问题进行一对一约束,并结合Gale-Shapley算法来实现多用户账号匹配,有效的提高了识别性能。4.由于现有的基于主观导向的赋权算法忽略了用户各项信息的特殊含义,致使大多数多用户身份识别算法存在权重失衡问题。针对此类应用场景,提出了基于两级信息熵的多用户身份识别算法。基于内容一对多项用户信息进行分析和相似度测量,并利用提出的基于后验概率的权重分配算法来获取用户信息的一级权重。将获得的一级权重组成一个多维向量作为Softmax函数的输入值,对各个权重进行归一化处理,得到归一化概率,并再次利用信息熵的概念来获取用户信息的两级权重。同时,采用双向稳定婚姻匹配算法实现多用户账号匹配,有效改善了现有权重分配方案造成的权重失衡问题,并提高了所提算法的通用性。
其他文献
随着多核处理器平台的广泛流行,如何从传统的串行程序中提取并行性,以提高其在多核平台上的执行性能已是当务之急。利用推测并行流水线技术由编译器自动地将串行程序转换成推
人工蜂群算法(Artificial Bee Colony Algorithm,ABC)是一种新兴的群智能算法。因具有参数少、搜索能力强等优点而受到关注。但是它仍有很多不足,面对多模态问题时收敛速度慢、容易陷入局部最优;面对多目标优化问题时难以获得良好分布的解集。为解决这些问题,本文一方面改进ABC算法原有的运行机制增强解决多模态问题的能力,另一方面引入新机制增强ABC算法解决多目标优化问题的能力。
经济全球化已经成为国际经济发展的趋势,不管是国家还是企业之间的竞争都越发地激烈,其要想赢得市场份额,提高竞争力,最重要的是要激发创新精神、加强科技创新行为。随着我国经济市场化进程的不断深入和科技发展的不断进步,民营企业在国民经济中发挥的作用日益显著。企业创新能力的提高有利于推动企业发展壮大,而且随着企业市场地位的提高,其创新行为也会随之发生变化。Schumpeter(1934)强调,企业家推动着技
铜版画的制作方式与其他画种不同,曾以精湛的复制能力成为欧洲主流的艺术媒介之一,经过几个世纪艺术家们的努力,铜版画的制作方法随着人们科技的进步而发生一系列改变,成为人们表达思想感情和表达艺术理念的手段之一。而铜版画的发展过程,同其他画种一样,都是在不断地发展和批判之中起伏着向前发展的。由于铜版画具有高度复杂性,使得一些铜版画爱好者和学者过度的执着于技法的研究,而忽视了艺术作品中最重要的情感表达,本文
慢性难愈性伤口是指一类与创伤部位和宿主有关的创面在预期的时间内不能正常的愈合。小腿部位由于软组织储备少,站立和行走易引起静脉淤血,加上局部血液循环相对较差,外伤后
随着我国经济有条不紊的快速发展,公路交通系统得到了迅速的发展。尤其是2013年国家提出“一带一路”战略大幅度推进了基础设施建设,给大件运输行业的发展带来了更多的新挑战。其中,由于国家重大建设发展需求,重大型设备在中小跨径桥梁上运输行业不断扩展,对中小跨径桥梁的使用寿命和承载能力造成巨大的影响。对此,大件运输车辆的通行评价至关重要。中小跨径斜梁桥是中小跨径桥梁中特殊的一部分,具有不同于等效直桥的受力
信用卡在中国的发展史最早可以追溯到1985年,由中国银行珠海分行发行了我国金融史上首张信用卡。从此之后伴随着改革开放的不断推进,银行信用卡业务的发展也日益兴盛。在2018年中国银行行业协会发布的信用卡产业蓝皮书当中做出了具体的统计,截止到2017年年末,我国在当年共发行了5.88亿张信用卡,比2016年年度增长了26.35%。从这一数据当中不难看出我国信用卡业务的迅猛增势,同时也反映了当前中国国内
合作学习对教育界的人士来说并不陌生,可谓是“老生常谈”。自20世纪80年代引入中国,刚开始的研究是从理论上的借鉴,后来逐渐加深探究出了符合中国教育现状的有效实践。加之新课改不断推进,小学作为义务教育的基础和奠基阶段,为提高教学质量,课堂小组合作学习被推上历史的舞台。虽然很多学校都提倡采用小组合作学习的方式进行教学,但笔者发现这一教学方式虽然被广为推广,实施效果却不佳。随着改革的不断深入,小组合作学
化工是宜昌市的第一支柱产业,产值一度占湖北省化工行业比重三分之一,随着经济发展兴起的沿江磷化工产业,为宜昌经济社会发展做出了大量贡献的同时,也给宜昌大气、土壤、水资源等带来了很多污染。一段时间内,宜昌市沿江化工企业安全生产事故频发,环境污染问题严重,形成“化工围江”困局,引起社会广泛关注。近年来,为了落实长江大保护的要求,宜昌作为三峡生态经济合作区发起者和先行者,认真贯彻习近平总书记关于长江大保护
聚碳酸酯二醇是分子链段末端带有两个羟基(-OH),主链上含有重复单元脂肪族亚烷基和碳酸酯基团(-OCOO-)。以聚碳酸酯二醇制备得到的聚氨酯具有高的力学性能、高抗热性、高抗水解性能以及良好加工性能。本文对课题组新开发出的新型聚碳酸酯多元醇(NPPC,novel polycarbonate diols)的性能进行了详细研究,并对该新聚碳酸亚丙酯多元醇的精制脱催化剂工艺进行了研究;本文还以该新型聚碳酸