基于多源用户评论的评分预测研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:sylviawan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在“大数据”时代,互联网上每天都会产生海量数据,造成“信息过载”问题。“信息过载”问题是指人们在获取自己感兴趣的信息时,因为面对的信息过于繁杂,很难找到自己真正需要的信息。推荐系统是当前应对“信息过载”问题最有用的方法之一,在诸多领域都发挥着重要的作用。协同过滤推荐算法作为当前使用范围最广的一种推荐算法,可以对用户的历史行为记录进行统计和分析,从而挖掘出用户偏好以及物品属性,为用户提供更精准的个性化推荐服务。协同过滤推荐算法还可以挖掘出用户没有表现出来的偏好,提高推荐结果的多样性和新颖性。但该算法有一个严重的缺陷,在用户-物品评分矩阵极度稀疏时,存在数据稀疏问题,预测准确度会受到很大影响。传统的推荐算法往往只利用用户对物品的评分或用户的历史行为记录来获取用户偏好,忽视了用户评论中包含的信息,因此会造成推荐结果出现偏离。用户撰写的评论往往蕴含着丰富的语义信息,可以反映用户对物品不同属性的偏好。近年来,随着隐含语义分析技术的发展,研究者们开始通过使用用户评论更精准地获得用户偏好和物品属性,从而提高个性化推荐的准确度。聚焦于推荐系统中的评分预测问题,本文主要通过利用用户历史评分信息,结合评论补充算法对用户评论进行扩充,针对数据稀疏问题提出了基于多源用户评论的评分预测算法。其中主要包含了以下方面的工作:·分析当前推荐算法的研究现状,对传统的协同过滤算法以及基于评论文本的推荐算法进行调研。·提出了基于多源相似用户评论的评分预测算法。该算法首先设计评论补充算法为每个用户从相似用户处收集补充评论,其中相似用户是指具有相似消费行为和历史评分记录的用户;然后运用隐含语义分析技术提取评论中蕴含的用户偏好信息和物品属性信息;最后使用多层感知机将用户偏好信息和物品属性信息进行整合,实现基于多源用户评论的评分预测模型。·通过在四个基准数据集上完成验证实验,对本文提出的算法与传统的基于协同过滤的评分预测算法以及基于评论文本的评分预测算法进行性能比对。实验结果表明,相比于传统的基于协同过滤的评分预测算法以及基于评论文本的评分预测算法,本文提出的算法性能有所提高。·对基于多源相似用户评论的评分预测算法进行了改进,提出了基于多源用户评论的评分预测算法,通过在四个基准数据集上进行消融实验,验证了该算法的有效性。
其他文献
随着电子游戏的日益普及,游戏用户的大脑也在频繁使用中受其影响,发生功能和结构上的可塑性改变,因此研究游戏过程中大脑潜在的活动的变化规律对于加深脑可塑性理论和科学对待游戏产生的积极和消极影响是必要的。动作类即时战略游戏(Action Real-time Strategy Gaming,ARSG)可视为一项需求注意力、感觉运动能力、高水平的团队合作和决策能力的,对认知能力有着较高要求的动态交互任务。因
近年来,在“走出去”和“一带一路”等对外开放政策的推动下,越来越多的中国企业走出国门,采用跨国并购的方式来实现自身跨越式发展。我国企业的跨国并购对象以发达国家的企业为主,这些企业往往实力雄厚,品牌知名度高,我国企业作为并购方,与之相比处于弱势地位。这种以弱并强的方式就是我们所说的“蛇吞象”式并购。相较于国内企业之间的并购,跨国并购的难度较高,而对于“蛇吞象”式的跨国并购来说更是如此。巨大的并购难度
石墨烯(Graphene)被公布以来,凭借独特的结构和优秀的性能在光学、电学等科研方向成为被研究的热点。在光电探测领域,石墨烯凭借着高载流子迁移率、宽光谱吸收能力、高光电响应度使其引起了广泛关注,但是石墨烯偏弱光吸收率、光生载流子过快复合等原因也阻碍了石墨烯在光电探测领域的发展。为解决上述问题,研究院不断探索新的办法,例如改变光电探测器器件结构,或者引入新的半导体材料,针对此类问题,本文首先确定了
知识图谱能从海量文本和图像中提取出需求的信息,有着广阔的应用场景。领域知识图谱作为知识图谱中的一种,由于存在数据难以获取和处理等问题,故当前对领域知识图谱的相关研究较少。暗网作为一个神秘的领域,和明网不同,暗网中进行的交易大部分存在违法的情况,甚至对国家安全造成了一定的威胁,故进行暗网领域的知识图谱构建迫在眉睫。针对上述问题,本文的研究重点集中在暗网中文交易链知识图谱的知识获取和应用方面。主要研究
高送转作为股利政策的一种,理论上来说可以优化股本结构、向外界传递业绩高增长的信号,有助于维护公司积极正面的形象。一经发布,常常受到投资者的极度欢迎。但是近年来,市场乱象频现,尤其是创业板市场,无论企业自身经营业绩如何,是否具备高送转条件,每到年中或年底,就开始炒作高送转热度。那么,高送转股利政策到底有何魔力吸引了如此多的关注。特别是最近两年,在政策监管更加严格的情况下,一些不具备实施条件的创业板上
近年来,伴随着互联网信息技术的飞速发展以及移动网络的快速发展,软件应用的数量急剧增长。随着软件应用被广泛地使用,一些在软件设计阶段或者开发过程中产生的漏洞很有可能被攻击者利用,从而造成恶劣的影响。作为软件安全的首次审查,从源代码层面及时修复漏洞可以有效减少软件漏洞带来的损失以及节省后续阶段修复漏洞的成本。目前代码的审计工作离不开人工参与完成,当前主流的检测方法是自动化测试工具结合人工检查共同完成,
近年来,随着人工智能领域突飞猛进,深度学习技术为自然语言处理各个方向带来了极大的发展。借助自然语言处理技术和深度学习算法,人们可以从文本中抽取出结构化信息。从数学文本中抽取知识并通过知识的推理实现类人答题的目标成为一些国内外学者研究的方向,其中初等数学关系抽取成为重要研究方向之一。依赖前人的工作和研究成果,本文将知识图谱应用到初等数学关系抽取的研究上。本文主要研究内容有:1.本文提出了一种基于文本
在当下,嵌入式系统广泛应用在各个行业的各个方面,各领域的需求和使用场景越来越复杂的,传统单一的系统必然会有难以满足的情况存在,这只能造成现有平台的设计越来越冗余。在上述背景下,为了解决复杂业务场景的协同等等问题,在实际需求的推动下,嵌入式系统自然而然会引入多操作系统架构平台,或者说是嵌入式虚拟化平台。应用在嵌入式系统的虚拟化技术,主要目标就是在一套硬件设备上支持两个或多个执行环境,并且在嵌入式硬件
ISO9001《质量管理体系要求》是国际通用且被众多组织证明是行之有效的质量管理体系标准,贯彻ISO9001标准在不同程度上促进了组织的规范化管理,提高了产品和服务的质量。但在看到ISO9001标准给组织带来正面效应的同时,一些组织在贯标过程中存在的"两张皮"问题也不容忽视。本文分析了质量管理体系运行中存在的"两张皮"现象及其原因,阐述了通过贯彻新版标准GB/T19001-2016的新要求,
期刊