【摘 要】
:
推荐系统是当前缓解信息过载问题的主要手段之一。它为用户筛选掉大量冗余、不相关的数据并从中挑选出有价值的信息,这不仅大幅改善了用户体验,同时也显著地提升了企业的商业收益。协同过滤是搭建个性化推荐系统的关键技术,它着重于通过集体智慧和经验来推断用户对物品的偏好。该技术面临的主要挑战是“用户-物品”交互数据稀疏的问题。现如今社交媒体迅速发展,社交网络中流通着大量与用户兴趣偏好相关的信息。因此,用户社交链
【基金项目】
:
国家自然科学基金项目(#61671048,#61672114,#61862005);
论文部分内容阅读
推荐系统是当前缓解信息过载问题的主要手段之一。它为用户筛选掉大量冗余、不相关的数据并从中挑选出有价值的信息,这不仅大幅改善了用户体验,同时也显著地提升了企业的商业收益。协同过滤是搭建个性化推荐系统的关键技术,它着重于通过集体智慧和经验来推断用户对物品的偏好。该技术面临的主要挑战是“用户-物品”交互数据稀疏的问题。现如今社交媒体迅速发展,社交网络中流通着大量与用户兴趣偏好相关的信息。因此,用户社交链接成为稀疏的交互数据的关键补充,使用社交信息的社会化推荐模型可以实现更准确和可解释的推荐。传统的社会化推荐算法只考虑用户的一阶好友,而忽略了用户和他高阶近邻之间的信息传播。网络嵌入技术的流行为社会化推荐系统提供了新思路,它能够保证网络中具有相似结构的高阶近邻在隐空间中也有相似的嵌入。近期涌现出一些结合网络嵌入和矩阵分解的社会化推荐方法。这些方法大多预训练网络嵌入模型然后再把信息传递给下游的矩阵分解,这导致模型无法捕获适用于推荐任务的网络特性。此外,它们只关注于使用社交网络增强用户的特征表示学习,而忽略物品维度的特征表示。针对上述问题,本文提出了两种联合学习矩阵分解和网络嵌入模型的社会化推荐方案。第一种方案通过特征表示对齐的方式,把矩阵分解和网络嵌入模型集成到统一的优化框架。在联合学习的过程中两个任务相互增强,评分信息的监督使得网络嵌入模型学习到的网络特征更适用于推荐任务,而矩阵分解在融合多种信息的情况下也将获得更有判别性的特征表示。此外,显式的社交网络和隐式的“物品-物品”网络被协同使用,以此来同时增强用户和物品的表示学习。在三个公开数据集上大量的对比实验表明,通过特征表示对齐联合学习的方式以及双网协同嵌入都可以大幅提升模型的推荐性能。为了更深层次地建模用户和物品特征表示的交互,并完整地保留网络结构信息以及评分数据中的用户偏好和物品特性,本文提出第二种联合学习方案。该方案在保留适用于推荐任务的网络特性的同时,通过使用评分信息单独训练一部分特征表示的方式保留完整的用户偏好和物品特性。此外,我们使用多层感知器赋予模型非线性来学习用户和物品特征表示的交互。最后,对比最先进的社会化推荐方法的实验结果有力地验证了考虑上述两点的联合学习模型的有效性。
其他文献
图像数据在人们日常的沟通和交流中不可或缺,然而图像在传输和接收等过程中,往往会因为硬件设备等原因受到噪声的干扰,这会降低图像的质量,并影响后续对图像的处理与分析。因此,去除图像噪声至关重要。目前,如何在去除噪声的同时保护图像的纹理细节仍是亟待解决的问题。近年来,稀疏表示理论的兴起使图像去噪取得了较大的突破。因此,本文以稀疏表示理论为基础,对稀疏变换学习图像去噪算法以及组稀疏残差约束图像去噪算法进行
多标签文本分类是自然语言处理领域的一项重要任务,它旨在将一段文本内容分给一个或者多个类别。这一任务的难点主要在于标签的数量庞大,并且标签呈现出不均衡的长尾分布,即大量尾标签的出现次数远远少于小部分的头标签。尽管相较于传统的方法,基于神经网络的方法能够提取到更丰富的文本特征,并提升分类的性能。但是这些方法通常假定标签之间相互独立,不能充分利用标签中包含的信息,例如标签之间的相关性。然而标签之间通常具
在现如今的互联网世界中,多视图数据呈现出爆发式增长的趋势,如何高效地挖掘多视图数据中的信息并服务于大众已经成为学术研究众多问题之一,其中多视图数据的表示学习也是一大热点。多视图数据是指通过不同的视角、不同的形式对同一个对象的客观反映的数据集合。多视图数据有两个显著的特点:一致性和互补性,不同的视图往往反映一致对象的互补特性,因此通过观测多视图数据能够更加充分的理解对象的特点。除此之外,多视图数据也
中医是重在调理、以预防为主的独特的传统医学,经过代代传承至今。经典医案作为当今中医的成功案例被各大期刊杂志记载,能够对临床诊疗提供理论支撑。但在临床应用上,由于不同医生对概念表达多元化,局限于过去构建的概念库,难以将新的表达对应到已有的概念上。因此,进行症状的概念映射成为获取患者特征的关键步骤。来自古现代中医书籍等多渠道的知识,所构建的知识图谱能够建立症状,药物等之间的关系。本文基于较大规模的医案
随着互联网的飞速发展,缓存技术(caching)的应用范围越来越广,从最初的操作系统和CPU,到如今的服务器和边缘节点。随着边缘计算等概念的相继出现和普及,缓存有了更丰富的应用场景和落地方式。通常来说,对于热点内容的缓存能减少不必要的开销并提升效率。在边缘计算场景下,利用边缘节点靠近用户的特点,预先在边缘节点中缓存热门视频,能缩短用户获取视频的时间,大幅提升用户体验。然而,热门视频可能会有很多,单
基于人脑磁共振图像的个体认知参数定量估计一直是认知神经科学领域的一个研究热点,这类研究不仅可以探究大脑结构和功能的个体差异性,也有助于神经精神类疾病的辅助诊断与早期预警。然而目前大部分研究都是基于单标签技术而不是多标签技术,而多标签学习考虑了标签之间的相关关系,可以提供更丰富的信息,从而提高预测的准确率。目前的个体认知参数定量估计研究大多还是基于静息状态功能磁共振图像(fMRI)开展的,近期研究表
视频目标分割是指将视频序列每一帧中感兴趣的目标区域从背景中分离出来。其中,无监督视频目标分割需要在未给定任何目标信息的前提下,将特定前景目标进行分离,因此成为当前的研究热点和难点。另外,视频序列的复杂性和多变性对无监督视频目标分割的准确性提出了更高的要求。因此,如何充分发掘并有效利用视频序列中丰富的信息以实现更为准确的无监督视频目标分割具有非常重要的研究价值。本文重点研究了如何充分利用视频序列中的
前列腺癌多年居于全球男性癌症发病率的首位,随着人口老龄化进程的加快以及经济的发展,中国男性前列腺癌患者数量呈现快速增长的趋势。动态对比增强磁共振成像(dynamic contrast-enhanced magnetic resonance imaging,DCE-MRI)是一种能够反映组织生理学信息的非侵入性的影像学检测手段,通过药代动力学模型的拟合可获得与组织生理特性相关的量化参数,可用于良恶性
软件可靠性指的是软件产品在规定条件下和规定时间内不引起系统失效的能力。软件可靠性预测即基于测试和运行维护期间观察和收集到的失效数据对未来软件可靠性进行预测。软件可靠性预测模型是软件可靠性预测的基础,通过对软件失效过程进行建模从而预测软件失效行为,保障软件可靠程度。随着人工智能技术的发展,深度学习模型在软件可靠性预测领域已经得到了初步应用。其中,长短期记忆(Long Short-Term Memor
CPU是电子信息技术的核心,而基于RISC-V指令集架构的CPU芯片设计越来越受到人们的重视,对该指令集架构的深入研究已然成为目前CPU芯片行业的热点,本论文主要研究了RISC-V指令集架构的结构特点,并基于SMIC 0.18 um CMOS工艺设计了一款基于RISC-V指令集的CPU芯片。本论文对CPU的系统结构进行了概述,对CPU设计中的关键部分,即流水线以及转移预测进行着重介绍,并对目前最为