基于深度学习的推荐模型及算法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:yt66896915
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,信息技术时代逐渐过渡到数据技术时代,数据在人们的生活中充当着越来越重要的角色。面对无所不在的数据,如何从当中获取到所需的信息变得十分困难了,这就是所谓的“信息超载”问题。传统的推荐系统在一定程度上缓解了这个问题,通过分析用户的历史行为,从海量的数据中分析出用户的偏好,并把具有用户偏好的物品推荐给用户。然而在实际应用中存在数据稀疏、冷启动等问题,它会导致推荐系统准确率低、推荐单一。针对上述问题,本文主要做出了以下工作:首先,本文提出了一种结合Skip-gram和加权损失函数的深度神经网络推荐模型DSM。DSM模型采用了包含三层ReLU层的结构来构造深度神经网络模型,结合Skip-gram进行项目嵌入得到稠密的表示向量,使用加权损失函数训练深度神经网络的参数,在未使用附加信息的前提下提高了推荐精度,平衡了推荐物品的受欢迎程度,保证了新颖性。其次,DSM模型仅使用了评分矩阵,本文在此基础上提出一个评论文本和评分矩阵交互的深度模型ELM。该模型能够提取评论文本和评分矩阵的深层次特征,并结合它们进行评分预测;通过使用预训练的Electra模型得到每条评论的隐表达,结合深度情感分析及注意力机制实现从上下文语义层面对评论文本的分析,解决了短文本的语义难以分析的问题;在融合层模块中,用户(物品)评论和评分矩阵进行交互,最终预测出用户对商品的评分。最后,分别对两个模型进行实验。在APP数据集和Last.fm数据集的实验结果表明,DSM模型在推荐应用程序和歌曲时,准确性和多样性方面相比现有方法具有一定的提高。ELM模型在6组数据集上进行性能对比实验,实验结果表明该模型性能优于其他系统,且平均预测误差最大降低了12.821%。通过以上实验,本文提出的两种模型均适用于向用户推荐精确的物品。
其他文献
随着互联网的快速发展,人类的活动得以进一步扩展,各行各业累积的数据规模急剧膨胀,数据量越来越大,如何从海量的网络资源中快速准确地获取主题信息逐渐成为搜索行业研究热点。主题网络爬虫可以专业化、精准化的提高搜索信息的准确度。准确度的评价指标主要有查准率和查全率,查准率依赖于主题相关性计算,查全率则取决于网页搜索策略的选择。因此,本文围绕主题爬虫的两大关键技术:网页主题相关度计算方法和网页搜索策略开展研
视网膜血管作为人体微循环系统的重要组成部分,糖尿病、高血压等心血管疾病会造成血管的形态变化,医生可以以眼底血管图像为依据,判断患者的患病类型和严重程度。因此,从彩色眼底图像中提取出视网膜血管,在心血管疾病的预防和分析中起着重要的作用。人工视网膜血管分割方法耗时且代价昂贵,不仅需要大批眼科专家,也无法在全国范围内筛查,所以需要依托于自动分割技术。现阶段已经提出大量自动分割方法,然而视网膜血管极为复杂
随着互联网技术的迅速发展以及大数据时代的到来,使得大数据相较于传统数据,具有了4V特性——海量、变化速度快、多模态、价值总量高,4V特性导致传统分类算法和处理平台很难处理大数据,近年来并行化技术和特征选择型分类算法的发展为大数据处理提供了一个新视角。DCNN(Deep convolution neural network)是分类算法中的一类重要算法,具有强大的特征选择能力、泛化能力以及函数逼近能力
近年来国家金融、政府等基础设施部门饱受高级持续性威胁(APT)攻击的困扰,但由于分析样本的缺失,针对APT攻击的研究一直没有取得较大的进展。随着震网病毒、乌克兰停电事件、NSA武器库被盗等问题的发生,人们开始逐渐重视起这种持续时间长、攻击复杂性较高、危害性较高的网络攻击。并且由于传统的访问控制、黑白名单等检测手法无法很好的应对APT攻击,一些人工智能的方法也被引入来进行APT攻击的检测。综合其现有
复杂网络的社区是一个内部关联紧密但外部关联稀疏的节点聚类,属于网络的子图。网络的社区构造帮助我们在中观层面上描述复杂网络,分析局部和整体的关系,揭示网络的关联信息和内在属性。因此,社区发现算法的研究,对于深入理解和掌握复杂网络的基本特征具有重要意义。科研人员常运用智能优化算法理论来解决复杂网络的社区发现问题。但是,这类算法种类庞杂、标准不一,而且均需要预先设定参数来控制社区划分的侧重,无法做到自动
我国目前已是世界最大的铜材生产国,但仍不是铜材生产强国,低端产能相对过剩,而高、精、尖等高端铜材产品部分仍依赖进口,难以满足我国各行业对高端铜材的需求。此外,我国数量众多的中小型铜加工企业的产品质量水平及成品率普遍较低,这也是制约我国铜加工行业发展的突出问题,而究其原因,铜加工企业产品质量问题主要是由生产工艺技术上管理粗放造成的。近年来,为实现提质增效的目标,在国家及地方政府的政策鼓励下,国内铜加
糖尿病视网膜病变、心血管疾病、高血压、动脉硬化等多种疾病对视网膜血管产生不同影响,可通过分析视网膜眼底图像中血管的长度、宽度、角度、弯曲度和分支形式等特征来诊断。人工分割视网膜血管是一项繁琐、复杂和专业性极强的工作,且分割标准主观性强。为提高医生的诊断效率和降低误诊率,需借助计算机辅助诊断系统,其核心是设计先进的分割算法,以实现快速自动化视网膜血管分割。于是,本文分别提出了两种分割算法:基于多尺度
随着新兴技术的不断涌现和持续应用,中国制造业在过去十年间发生了翻天覆地的变化,在不断适应多变的社会需求和激烈的市场竞争的过程中,制造型企业慢慢从以量取胜向着以质取胜发展。质量意识的不断提升,使得越来越多的制造型企业开始注重生产的规范化与标准化,标准作业指导书由此受到越来越多的关注。然而,标准作业指导书在规范作业程序的同时,自身的制作流程却没有实现标准化作业,这是因为许多企业重点着力于生产线的优化改
目的研究行电子输尿管软镜下钬激光碎石术治疗的肾结石患者开展手术室人性化护理干预的效果。方法选取玉山县人民医院2019年8月—2020年1月期间收治的肾结石患者56例为研究对象,均接受电子输尿管软镜下钬激光碎石术治疗,采用双盲随机法分为研究组(28例)及对照组(28例)。对照组行手术室常规护理,研究组患者在此基础上接受手术室人性化护理干预,对2组患者术后恢复情况进行比较分析。结果研究组患者术后离床及
随着GNSS等新技术的发展,大坝变形监测已经实现全天候实时动态化,传统的大坝变形预测方法不能很好地对海量的监测数据进行处理。深度学习是在神经网络的基础上对网络层数加深的优化算法,目前已经在风电、空气质量、灾害预警等领域广泛应用。相对于传统的机器学习算法,深度学习强调从海量数据中进行学习,能够解决大坝变形数据中存在的高维、冗杂以及高噪等传统机器学习算法难以处理的问题。因此,非常有必要开展基于深度学习