多领域主动学习推荐算法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:angelagao00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着个性化推荐技术在互联网中的广泛应用,人们在面对海量的数据可以快速的做出抉择。然而,当前推荐算法存在一些问题。一方面,很多网站的数据往往包含多个领域,如豆瓣电影有喜剧片、爱情片和动作片等,针对包含多个领域的网站设计推荐算法时需要同时考虑领域共享的知识和领域特有的知识;另一方面,随着个性化推荐技术的发展,数据的稀疏性成为了制约提升推荐质量的瓶颈,因此,如何更高效的获取评分数据成了关键。近年来,主动学习方法被提出用来解决推荐算法中稀疏性问题。本文基于个性化推荐技术、多领域推荐模型和主动学习展开相关研究,提出了一种针对多领域推荐的主动学习算法,具体工作如下:1.提出一种新的问题,即利用主动学习技术解决多领域推荐算法中的稀疏性问题。该问题的挑战在于传统的基于主动学习的推荐算法是针对单一领域上的数据稀疏性问题,在主动获取数据时忽略了跨越领域之间的知识。因此,如果将传统的算法直接应用在多领域推荐时,会浪费更多的人工标注成本。针对这个问题,本文设计了一种全新的多领域主动学习策略,其能够在主动获取数据时不仅能够考虑不同领域内部的特有知识,还可以考虑多个领域之间的共享知识。2.针对多领域推荐模型中的领域特有特征和领域独立特征,分别设计基于期望信息熵主动学习策略和基于方差的主动学习策略来衡量这两部分的泛化误差,进而使多领域主动学习策略可以应用在具体的多领域推荐模型中。3.设计与实现了一套多领域推荐实验系统。在五个由真实数据构成的多领域推荐任务上进行性能对比、显著性测试和参数敏感性等三组实验,实验结果表明本文题出的主动学习策略优于当前的主动学习策略,能够极大节约人工标注成本,并且具有良好的稳定性。
其他文献
近二十年来,交通运输事业得到了巨大的发展,我国的桥梁建设进入了“建养并重”的可持续发展道路,在实际工作中发现,有相当一部分旧桥存在资料缺失或资料不全的状况,特别是跨
<正>随着近几年科学技术的发展,越来越多的软件应用于工作、生活之中,然而,由于网络自身的的弊端,软件的多样化带来的就是越来越多病毒软件的滋生。所以,为了避免恶意软件的
新课改根据现有国家教育现状及学生素质能力,大力提倡在教学中培养学生自我诊断能力。而在传统的教学环境下,学生自我诊断能力较差。在初三化学复习中,使用思维导图比传统的
数码影像技术日趋成熟,其应用的领域也越来越广泛,我国公安、司法机关在实践中应用数码影像证据的实例也在增多。它在各类刑事案件中,对揭露犯罪、证实犯罪和打击犯罪发挥着
媒体在面临生存压力的背景下,为了追逐经济利益,刻意满足受众的心理需求,将新闻报道的触角延伸到公众人物的隐私领域,新闻采访、新闻报道中侵犯公众人物隐私权现象频频发生,
本报6月2日讯(YMG记者 李仁 通讯员 张海庭 王举文 )观众席、公众评委席、监督席、专家评委席、答题席……今天上午,牟平区公开选拔镇街团委书记、副书记面试考场,8分钟答题时间
报纸
介绍了Prime-G+技术在兰州石化公司新建180万t/a催化汽油加氢脱硫装置应用情况,装置标定结果表明:催化汽油硫含量从0.0195(m/m)%降低到0.00385(m/m)%,RON损失1个单位,(RON+MO
<正> 一、病历那曲镇三居委三组私养的1头4岁母牦牛。主诉:经常看到吃烂杂质的东西后引起体质消瘦,食欲异常,大便也不正常,后经药物治疗多次无效。
期刊
本研究通过对常州市不同功能区道路雨水径流进行采样分析,结合CFD模型,在实验条件下研究专管储存技术对道路初期雨水截流效果,对示范工程进行预评估,并在实验条件下探讨无压