论文部分内容阅读
大数据时代的来临使得网络中的信息呈指数级增长,改变了人们接收信息、利用信息、传播信息的方式,而受制于人们处理信息的能力有限,爆炸式的信息同时也带来了“信息过载”问题。近年来,随着神经网络技术的发展,具有大规模数据处理能力、特征自动提取和组合能力、平衡记忆与泛化能力的深度学习推荐系统成长为了互联网的增长引擎。然而,推荐系统的数据类型多样,数据表现形式复杂,难以像自然语言处理、计算机视觉等领域将问题抽象为单纯的对序列数据或欧式空间数据的处理。图神经网络的出现带来了对定义在非欧氏空间上图数据的深度学习方法,为更高效、深层次的利用图数据带来可能。同时,图这一数据结构亦能够有效将推荐系统中所利用的关键数据进行有效组织。因此,在基于深度学习的多阶段推荐系统框架中应用图神经网络作为挖掘方法探究其可行性及实现方式,有广阔的探索空间和利用价值。本文基于图神经网络技术对推荐系统进行研究,提出算法以解决多阶段推荐系统的三个子问题:1.在推荐匹配阶段,设计深度学习方法基于图数据及序列数据完成匹配任务。本文提出图卷积与Transformer结合的推荐匹配模型—GCNTREC。该模型基于图卷积神经网络构造图信息提取器,融合推荐用户-物品二部图节点邻居信息并生成节点的稠密向量表示,该表示能够在以Transformer作为序列特征提取器的深度推荐模型中以融入图信息表达的形式增强推荐效果;2.在推荐排序阶段,同时有效利用图类型辅助信息和协同过滤以完成CTR预估任务。本文提出图自编码器增强的多任务协同过滤推荐算法—GAM-CF。该模型通过设计多任务学习方法,将图神经网络对用户和物品辅助信息图的重构任务引入至传统协同过滤推荐任务。借助多任务学习同时优化多个损失函数使得互补的任务共享表征,从而改善原始任务表现的思想,提升CTR预估性能;3.为算法实验搭建直观可视化的平台,设计并实现轻量级推荐仿真系统。该系统以React和Flask为架构搭建Web服务,应用Redis、MySql等数据库结合业务需求合理组织数据,并整合了深度推荐系统服务,有效地将GCNTREC与GAM-CF在内的多种算法服务上线。本文对所提出算法在多个公开数据集上进行了对比实验,实验结果证明了 GCNTREC与GAM-CF均能在公开数据集上相比基准算法取得性能提升。轻量级推荐仿真能够满足以直观方法对推荐算法进行早期落地测试的需求。