【摘 要】
:
随着数据的飞速增长,推荐系统成为连接用户和数据的重要桥梁。通过对用户历史行为进行分析,推荐系统能够有效地挖掘出用户的偏好,完成各种类型的个性化推荐任务。在推荐系统如此重要且火热的当下,也面临着诸多挑战。在互联网数据飞速增长的同时,单个用户的交互数据却少之又少,这带来了严重的数据稀疏的问题,想要每个用户的静态偏好都得到准确且充分的表征变得十分困难。其次,当下正处于动态变化的世界,每一秒都有百万甚至千
论文部分内容阅读
随着数据的飞速增长,推荐系统成为连接用户和数据的重要桥梁。通过对用户历史行为进行分析,推荐系统能够有效地挖掘出用户的偏好,完成各种类型的个性化推荐任务。在推荐系统如此重要且火热的当下,也面临着诸多挑战。在互联网数据飞速增长的同时,单个用户的交互数据却少之又少,这带来了严重的数据稀疏的问题,想要每个用户的静态偏好都得到准确且充分的表征变得十分困难。其次,当下正处于动态变化的世界,每一秒都有百万甚至千万级别的数据在产生,传统的静态的推荐系统很难去捕获到数据的变化以及用户偏好的动态变化。因此,有效处理数据稀疏带来的挑战,同时针对动态的数据建模,是现有推荐系统研究的重点。本文作者针对推荐场景中用户行为偏好挖掘等问题,从用户静态偏好挖掘和用户动态偏好挖掘两个方面出发对基于卷积神经网络的用户行为偏好模式挖掘进行研究,主要贡献如下:(1)推荐系统的核心目标是为了准确刻画出用户的偏好,用户的静态偏好反应了用户的本质属性,然而极度稀疏的用户物品交互信息给推荐系统带来了不小的挑战。本文从不同源数据之间的一致性和互补性出发,提出了以卷积矩阵分解模型为基础的深度推荐模型CMF。具体来说,对于评分和评论这两个不同领域的信息,作者引入了投影层去挖掘出两者各自特有的部分与共通的部分,从而更加精确地刻画用户静态偏好。在三个真实数据集上的实验结果表明,CMF模型能够有效地对稀疏的用户行为数据进行建模,提升推荐任务的预测精度,同时得益于挖掘出了更多更有效的信息,CMF模型在数据集中的长尾数据上也有优异的表现。(2)用户和数据的数量和内在结构都在随着时间发生变化,用不变的思维去预测动态变化的事物是不可取的。本文借鉴蒸馏学习的思路,基于历史数据训练得到一个基础模型,基于现在的增量数据训练得到一个增量模型,两者组合成了本文提出的深度增量推荐模型DIR。在数据增长的过程中,作者主要关注新数据以及新旧数据之间的差异,而不是重训所有数据,同时作者首次提出了一种新的衡量数据变化程度的方法:数据迁移度。一系列在真实数据集上的实验证明了 DIR模型的性能显著好于已有的增量推荐模型。
其他文献
多源图像融合是将多类型图像数据中的互补信息进行有效的提取和整合,剔除冗余信息,生成信息更丰富、对场景描述更为准确的融合图像。多源图像融合技术有助于改善单一类型图像信息量不足的问题,提高多源图像数据处理的效率。目前,多源图像融合技术在军事、遥感、监控和医学图像等领域已得到了广泛应用。在各类图像中,红外与可见光图像在图像处理领域的应用最为广泛,且具有良好的信息互补能力。二者融合可以将可见光图像中丰富的
随着高速列车信息化与智能化水平的提升和“一体化屏幕”的引入,驾驶模式与驾驶界面出现了新的变化,良好的驾驶界面与信息组织模式能够实现驾驶员与系统的良好交互,从而提高高速列车运行的效率与安全性,因此有必要对高速列车驾驶界面信息组织模式的设计展开研究。本文构建了高速列车驾驶界面系统透明度等级模型,在此基础上,以高速列车故障处理界面为研究对象,设计了其界面信息组织模式,并通过人因实验验证了高速列车驾驶界面
近两年来,新型冠状病毒性肺炎已经造成了世界大流行的局面,该病毒最初是2019年末在武汉报道,随后在世界范围内传播。如今,更是有了病毒的变种,且已陆续在多个国家出现,对全球人类的健康构成了重大威胁。因此,新冠肺炎检测的相关研究具有深远且迫在眉睫的现实意义,它不仅可以高效快速地做出判断,还可以为医护人员提供指导信息,同时也在某种意义上对于个体的安全有了保障。为此,有必要提出一种检测系统来快速辅助诊断,
我国逐渐形成以“八纵八横”为短期规划的高速铁路网,与此同时,高速铁路也以其运行速度快、正点率高、输送能力强等特点受到人们的青睐。然而,因为各种不可避免的因素的干扰,列车的运行时常会偏离计划的时刻表。若未及时且有效的调整列车的运行计划,可能会危及行车安全。为了能给调度员提供较为精准的列车晚点信息,有效缓解因干扰而造成铁路运输效率下降和安全性降低等问题,本文实现了对列车到达晚点和出发晚点的准确预测。具
随着“十四五规划”和《中国制造2025》的提出,国家把“实施制造强国战略”提到了更加显著的位置。制造业是我国的支柱型行业,对国家的经济发展影响深远。在过去,一般传统制造企业的装配方式是单一装配线进行大批量生产装配,而随着用户需求的不断变化和市场竞争的逐渐加剧,混流装配线作为一种高效的生产方式逐渐取代单一装配线,在制造业中应用非常广泛。然而,由于混流装配线可以装配不同类型的产品,这些产品存在一定的共
超疏水材料由于其特殊浸润性引起人们的广泛关注,在防尘自清洁、防冰防雾、防腐蚀、油水分离等领域都展示出广阔的应用前景。随着研究和应用的深入,人们进一步对具有独特光学特性的透明超疏水材料产生了新的需求。人工透明超疏水表面的构筑中,目标表面的低表面能和在目标表面上构筑精巧微观结构是实现表面透明和超疏水的两大关键因素。尽管已经取得了一些进展,但是目前透明超疏水材料在耐久性方面还存在诸多问题,例如,容易被机
短视频电商分销将传统的线下分销商品转化为通过与短视频内容创作者合作直播或拍摄短视频进行产品的推广与售卖,将短视频用户转化为分销者,利用其流量进行获客。网络分销的优势体现在可以利用网络红人的明星效应,分销者只需要通过直播或短视频做好产品介绍,是零风险的代理模式;而供应商负责品牌推广、商品上单、订单核销及售后服务。本项目为快手本地生活提供给创作者找到本地生活商品进行分销的CPS平台,解决大部分没有私域
随着经济的飞速发展,我国的建筑结构已逐步朝着高层化,复杂化,多样化的方向发展。同时也面临着更严格的工程条件和更复杂的施工环境,许多应运而生的新变化、新思想和新要求使得普通混凝土已经无法满足现代建筑需求,需要更高性能的混凝土来代替普通混凝土。另外,传统的河砂日益枯竭,机制砂已经逐渐成为其可靠的替代品。相比于普通混凝土,机制砂混凝土同时具备高流动性,且原材料丰富。但是,有关普通混凝土性能指标的试验方案
以微流控通道为核心分析设备由于其具有便携性、低功耗、自动化、样品和试剂消耗少等优点有望取代传统的生化分析设备在生物技术、药物检测、环境分析等许多领域中的应用;基于光子晶体及金属等离子激元特性的生化传感器由于其灵敏度高、响应速度快、可以实现生化样品的实时监测等优点正受到越开越多研究者的青睐。本文围绕可以在微流通道下构建的胶体基光子晶体结构为研究核心,在微流通道下成功构建了含有聚苯乙烯微球光子晶体结构
脚本事件预测是指给定一系列已经发生的事件,预测后续发生的事件。该任务对于许多自然语言理解应用至关重要,例如文本理解、意图识别和问答系统。脚本事件预测是事件抽取的下游任务,目前还存在数据集缺乏、事件表示不全面、信息融合不充分等问题。现有的方法尚不能很好地解决这些问题。本文以脚本事件预测为研究课题,主要研究内容如下:首先,构建了一个基于新浪新闻的中文数据集SinaNews。目前,脚本事件预测任务仅有一