基于知识迁移和聚合的跨领域推荐算法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:zz33xx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息过载的互联网时代,用户如何从海量信息中获取有用信息成为热点研究问题,推荐系统为解决信息过载提供了有力的工具,但是传统推荐算法的性能受限于单领域中用户和项目的稀疏性问题,也受限于新用户无历史行为而面临的冷启动问题。由于不同领域存在用户群体偏好和项目属性类别的相似性和相关性,因此跨领域推荐能够通过学习辅助领域的知识预测目标领域的用户行为,从而丰富目标领域的信息以提高推荐准确率。基于此,本文开展了知识迁移和聚合的跨领域推荐算法研究,主要工作如下:(1)本文为解决用户冷启动问题、领域间评分矩阵直接拼接后提取特征导致的数据过于稀疏以及不容易泛化到新领域等问题,针对用户部分重叠的场景,从群体效应的角度提出了一种知识聚合和迁移相结合的跨领域推荐算法ATCF(Aggregation and Transfer Collaborative Filtering for cross-domain recommendation)与已有的跨领域推荐算法不同,在对共性知识和个性知识的表示和学习中,均充分融合了两个领域的特征。通过在群集矩阵及评分矩阵上的两级拼接和两次填充,得到共性知识表示,缓解了用户行为数据少以及新用户进入系统无行为的冷启动问题。通过知识迁移,构建了有区分的重叠用户和非重叠用户的个性知识表示,有效地避免了负迁移。通过基于知识聚合的共性知识表示和基于知识迁移的个性知识表示,提升了推荐性能。(2)本文为解决忽略领域中的用户个性特征及领域间用户对项目的交互特征而导致的负迁移和用户冷启动等问题,更好地学习个性化的用户特征,针对用户部分重叠的场景,从个体效应的角度进一步提出一种基于映射的注意力机制特征迁移跨领域推荐算法AFTM(Attentive-Feature Transfer based on Mapping for crossdomain recommendation)。该算法通过矩阵分解和注意力机制对用户进行建模,融合用户-项目交互特征构建用户特征向量,然后通过神经网络构建领域间的特征映射,捕获用户特征间的非线性关系,在此过程中融合了领域间用户交互特征,通过融合偏好为新用户提供推荐,并且群体偏好降低了数据稀疏度,在一定程度上避免了负迁移,提高了目标领域的推荐准确性。(3)本文在标准数据集Movielens和真实数据集豆瓣图书和豆瓣电影上进行了实验,实验结果表明,与只考虑单个域的推荐算法和其他跨域推荐算法相比,本文提出的两种跨领域推荐算法在冷启动用户的推荐性能上和所有用户的推荐准确性上有明显的优势,使得目标领域的推荐性能得到较强提升。
其他文献
目的:本课题旨在初步探索美洲大蠊提取物对大鼠酒精性肝损伤的保护作用,并利用基于1H NMR代谢组学筛选尿液和肝脏的差异代谢物,来阐明美洲大蠊提取物的代谢调控机制,为其改善酒精性肝损伤的临床应用提供科学依据。方法:大鼠随机分为正常对照组、酒精对照组、酒精+美洲大蠊提取物组。以酒精制备大鼠酒精性肝损伤模型,并用美洲大蠊提取物进行治疗。首先对大鼠的肝脏形态学、血清生化指标ALT、AST及肝脏生化指标SO
自1996年王海打假案胜诉至今,明知是不合格产品仍然购买并向经营者主张惩罚性赔偿的现象逐渐增多,以职业打假人为代表的知假买假人涉嫌侵权甚至财产犯罪的案例屡见不鲜。但在司法实践中,认定“知假买假”索赔行为是正当索赔行为还是敲诈勒索行为仍然存在较大的争议。对此,学界有不少学者开始基于知假买假典型案例对其刑事认定问题展开研究,但以个别案例为研究基点通常会缺乏对“知假买假”索赔行为从概念、分类、范围再到行
我国县级融媒体中心建设经过三年的发展,得到了业界和学界的关注。上海根据自身城市特征加强顶层设计,探索区域融媒体建设得到广泛肯定,被称为“上海样本”。未来我国县级融媒体中心建设还应提高站位,加大创新融合,提升能级。
现代激光技术的快速发展,对光学元件的性能提出了越来越高的要求。尤其是在高功率、高能激光系统中,直径大于100毫米的大尺寸光学元件被广泛应用,对光学元件质量要求更是苛刻。但光学元件的激光破坏阈值往往成为制约系统运行的不可忽视的重要因素。其中导致激光损伤的一个关键因素就是激光元件表面/亚表面的强吸收缺陷,这些缺陷通常具有微米尺寸。因此如何准确地对大口径光学元件中的这些缺陷进行检测,成为了研究光学元件本
行人重识别(Person Re-ID)旨在匹配不同摄像机下的行人,应用于智能安防、智慧城市等领域。随着深度学习和卷积神经网络的快速发展,在某个场景下采集数据进行有监督训练的模型,在该训练场景(即源域)中直接进行应用的性能已经得到了很大的提升。但是,将该模型迁移到另一个不同的场景(即目标域)上应用仍然是一个非常大的挑战。这是因为存在域间差异(两个域中的行人、背景等不同)以及域内差异(同一域中的不同视
伴随信息技术的普及、互联网时代的全面来临,计算机网络犯罪逐步呈现出高发态势且不断衍生出新的表现形式。中国刑法在面临严峻的时代挑战的同时对新型犯罪作出了积极的应对。《刑法修正案(九)》新增了三个有关于计算机信息网络治理的罪名,其中拒不履行信息网络安全管理义务罪给网络服务提供者设立了网络监管义务。该罪的创设是刑事法律首次规制网络服务提供者的不作为行为,具有刑法理论价值、司法实践指导双重意义。然而拒不履
随着现代社会的发展,人们越来越追求时间和空间的高利用率。而颗粒堆积就是一个跟空间利用率密切相关的问题,受到了各界研究人士的密切关注。颗粒堆积是一个复杂的、多样化的
目的:课题组前期研究已获得美洲大蠊抗肝纤维化活性部位的提取纯化工艺,但提取率较低。本课题以美洲大蠊粗提物为原料,采用酶解技术拟制备高得率、高活性的美洲大蠊抗肝纤维化活性组分,为美洲大蠊抗肝纤维化的后续研究奠定基础。方法:1.蛋白酶的筛选采用福林酚法和BCA法测定美洲大蠊粗提物中的蛋白质含量。以美洲大蠊粗提物的水解度、各洗脱组分得率和对大鼠肝星状细胞(HSC-T6)抑制率为评价指标,同时以原工艺作为
目的肺结核(Pulmonary Tuberculosis,PTB)患者中糖尿病(Diabetes Mellitus,DM)患病率逐年增加。因此,本研究分析糖代谢状态、血糖控制与肺结核患者抗结核治疗结局的影响,为临床制定肺结核合并糖尿病(PTB-DM)患者的有效治疗方案提供参考依据。方法采用巢式病例对照研究,收集2009年1月到2019年7月在4所结核病专科医院采用标准化方案进行抗结核治疗的肺结核患
中国古代一直拥有丰富的气象知识积累,但对气象现象认识一直停留在经验主义阶段,没有形成严密的科学体系,直至明清时期西学传入中国才开始气象学的萌芽,并且逐步建立了中国的