基于异构数据表示的推荐算法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zifeng20060819
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息的生产者和消费者在信息过载时代都面临巨大的挑战,而推荐系统在引导用户探索其实际需求方面起着至关重要的作用。基于矩阵分解的协同过滤算法作为推荐系统中最具代表性的模型,其基本原理是利用用户的显式和隐式反馈行为进行物品推荐,在用户和物品之间的交互信息不足时,产生的推荐结果并不准确。随着传统零售和生活服务向在线平台的快速转移,应用平台积累了众多领域的评论文本和商品图片数据,这些异构信息极大地补充了稀疏评分和交互信息,在数据层面为提高推荐算法的性能提供了新的思路。同时近年提出了基于优化的元学习范式,该方法关注如何在少量稀疏的数据上高效的训练与迁移模型,在模型优化层面很好的应对了冷启动推荐场景下历史数据不足的难题。已有一系列的研究试图利用评论文本中隐藏的丰富信息来应对数据稀疏和冷启动问题的挑战,提高推荐结果的质量。但是,这些研究仍然存在改进的空间:(1)现有的融合评论文本的推荐模型均从静态维度建模用户和商品潜在特征表示,忽略了用户即时兴趣以及物品属性和热点特征之间的相关性。(2)对评论文本的处理,大多数工作遵循将用户的评论拼接成一个独立的文档,再利用CNN或RNN处理文本信息类似的范式。而不同评论文本拼接而成的文档存在语义不连贯,上下文对应信息混乱等问题。(3)没有统一有效的框架联合处理评论文本和序列信息数据。因此,针对上述问题,我们提出深度融合评论和序列信息的个性化推荐模型,在不同时间维度上建模用户和物品的动态以及静态特征(Unified Model with Dynamic-Static Features,简称UMDSF)。具体而言,该模型通过两个分别基于自注意力和多头注意力机制的并行特征提取器网络,同时提取短期交互序列和评论文本中不同时间维度的细粒度特征表示。然后,在特征融合过程中,关注不同用户长短期兴趣的个性化展示和不同物品的不同方面潜在特征之间的相关性。在四个真实世界的公开数据集上进行充分实验验证了 UMDSF性能的优越性,同时设计消融实验和运行效率对比实验证明了模型结构设计的合理性和有效性。虽然现有的工作在一定程度上缓解了冷启动问题,其中大部分文献在数据层面利用辅助信息增强用户和物品的潜在特征表示缓解该问题,因此辅助信息的可用性和质量十分关键。另一方面,最近提出的元学习范式从模型优化角度为缓解冷启动问题提供了新的思路,由于该方法能够快速适应缺乏标签数据的新任务,换言之在冷启动推荐的背景下,用户和物品的交互信息本来就很少。从数据层面和模型优化两个角度出发,本文提出了基于元学习优化的异构数据联合表示学习推荐框架(Meta-Learning Tower Network,简记MLTN),通过物品的文本和图片之间的互注意力机制,分别用图片和文本的注意力特征来引导其对各自数据中高质量部分进行建模,消除了异构数据表示中常见的噪声问题。同时从模型优化角度将元学习范式集成到MLTN的参数优化中,使模型具备对新用户小批量数据的挖掘和泛化能力。工业数据集和公开数据集上大量的实验表明,MLTN在各种冷启动场景下的效果都优于最新的基线方法。
其他文献
随着频率标准的日新月异,高稳定度的频率传输技术广泛应用于空间观测、定位导航、移动通信等领域,已成为当下研究的热点。近年来,光纤通信飞速发展,由于光纤信道具有抗干扰能力强、稳定度高等特点,基于光纤的频率传输技术与基于卫星链路的传统同步方式相比优势明显,具有十分重大的研究价值。在光纤频率传输系统中,发送端通过光载射频方式将高稳时基信号传递到远端,同时接收端需要检测经过链路传输的光信号,提取出所需射频信
近年来,随着经济与科技的不断发展,城市化建设速度越来越快,导致地面土地资源不断减少,地上空间建设费用上升,因此许多国家开始进行地下物流仓储中心的建设用来应对上述问题。在地下物流仓储中心工作过程中,对于叉车、集装箱等设备的位置信息获取至关重要,因此选择适合的设备定位技术十分有必要。通过研究现有的定位技术,WLAN定位在地下应用场景中的缺陷较小,且不存在架设成本及地形限制的影响,但在地下物流仓储中心环
相比于普通的低密度奇偶校验(LDPC)码,空间耦合LDPC码凭借着码字在空间上互相耦合的特殊结构,有着优秀的译码性能以及较低的译码复杂度。然而,在空间耦合LDPC码的两种传统译码方式中,要么存储资源需求过大,要么不适于并行计算。因此,本文以低存储量与并行计算为目标,对空间耦合LDPC码的译码方式进行研究,并且给出基于不同译码方式的译码器的现场可编程逻辑门阵列(FPGA)实现。第一,针对传统译码方式
物联网(Internetof Things)应用作为5G系统里的一个重要的应用场景,随着时代的发展将迎来近百亿的设备接入量增长、数据流量的爆炸式增长以及不断出现的新应用场景。但是由于物联网业务的空间地理区域复杂多样,因此卫星物联网(Satellite Internet of Things)作为6G网络的一个重要应用场景被提出服务于难以建立可靠的地面回程链路的位置区域。为了弥补卫星通信网络长时延、链
安全服务是维护软件安全和保护业务数据的重要组件,保障软件安全无论是在传统环境还是在云环境下都至关重要。随着云服务的广泛应用,安全问题频繁出现,但是传统安全服务并不适用于云环境。因此在云环境下如何部署、使用和管理安全服务逐渐成为了业内关注和探索的主题。本次课题针对云安全服务的部署、使用和管理问题,对国内外的软件定义安全(SDS,Software Defined Security)方案进行了对比分析。
网络技术的飞速发展与网络基础设施的广泛部署促进了社会数字化转型发展,海量数据的计算、传输和存储也推动了大型数据中心的建设与智能化升级转型。流量调度作为一种有效利用网络资源的技术,能够优化网络性能并帮助网络快速适应业务变革。而传统的数据中心架构以及流量调度方式已不能满足低延迟连接、高质量传输的需求。因此,本文主要研究了数据中心场景下基于软件定义网络架构的动态流智能调度机制。具体论文工作与研究内容如下
随着近年来互联网的高速发展和普及,本人所在的企业积累的数据量呈指数型增长,对于大数据分析技术的依赖性也越来越强。搭建大数据任务调度平台,为企业进行海量数据的提取、分析、落地及查询等工作提供一体化的解决方案,降低数据的管理成本,聚集数据、提供创建更完整的数据画像的基础条件,为企业深度挖掘数据中的潜在价值提供基础条件成为了该企业的刚需。一个完备的大数据任务调度平台,不仅需要该平台有强大的数据计算能力,
企业如何履行社会责任,一直以来都是社会关注的热点话题,尤其是这些年来,我国已经一跃成为全球第二大经济体,企业作为引领国家经济发展的强劲队伍,更是肩负了更多的社会责任。作为企业社会责任最重要的表现形式,企业慈善捐赠无疑备受理论界关注和重视。我国自古以来就有“助人为善”的优良传统,随着改革开放以来经济的飞速提高和经济实力的不断增强,我国的慈善事业也得到十足的发展。不断有企业认识到慈善捐赠不仅仅是纯粹的
随着我国城镇化进程的推进,大量人口走进城市,但城市的面积并没有随着城市人口的增长而等比例的扩增,城市绿化面积日益紧缺,城市的居住与生态环境不断恶化,人们日益增长的绿化需求与城市绿化面积稀少的矛盾逐渐凸显了出来。而室内绿化作为改善城市居民生活与居住环境的重要方式,对人体身心健康有诸多好处,为解决城市室内绿化推广过程中遇到的“没地方养”、“养护困难”和“养护成本高”的现实问题,本文设计并实现了一套基于