【摘 要】
:
由于近年来互联网用户数量的持续增长,各种类型的用户数据也日益增多,而且数据量的增长也愈来愈快。用户在互联网上所面对的信息愈来愈多,在海量数据中找到想要的信息变得愈
论文部分内容阅读
由于近年来互联网用户数量的持续增长,各种类型的用户数据也日益增多,而且数据量的增长也愈来愈快。用户在互联网上所面对的信息愈来愈多,在海量数据中找到想要的信息变得愈发困难。推荐系统主要作用就是为了应对当前的信息过载问题,主动且准确地给人们发掘有用的信息。如何将大量的不同类型的用户数据联系起来并将其转换为有效的信息是推荐系统中的一个重要的问题。在一些视频、音乐及读书等网站的推荐系统中常常需要预测用户评分,以此来判断用户的偏好。大部分情况下用户的行为日志都是很少的,使得现有的一些基于矩阵分解的用户评分预测算法计算出的用户评分预测偏差过大,预测准确率无法进一步提升。在这个问题上,最常使用的解决办法是加入用户的社交网络数据,这些方法利用用户之间的社交信息来关联用户,根据用户好友的数据来减小对用户偏好的预测误差。在没有使用用户社交网络数据的基础之上,针对推荐系统的用户评分预测中常用的概率矩阵分解模型的准确性问题,提出融合标签和用户聚类类别信息对原有的概率矩阵分解模型添加约束来减小预测结果的误差。本文的主要工作包括:1、分析并研究了国内外基于矩阵分解的推荐系统的发展及其研究进展,对常见的基于矩阵分解的推荐算法以及本文涉及的组推荐技术、基于标签的推荐算法进行了简要的概述,阐述了一些现有的基于矩阵分解的推荐算法的一些问题。2、针对推荐算法领域中用户评分数据非常稀疏的问题,提出了融合标签和组推荐技术的评分预测算法。该方法通过聚类算法尽可能将相似用户分到同一个类簇,并结合相似用户的偏好来增加预测准确率。3、在概率矩阵分解的基础上结合用户打标签的数据来解决用户打分数据非常稀疏的问题。本文的创新之处包括:1、提出了一种结合了组推荐技术和概率矩阵分解的推荐模型。该方法通过用户聚类来将相似的用户聚到同一类簇,并通过同一类簇用户的偏好来帮助预测每一个用户的偏好。2、提出在概率矩阵分解中加入用户打标签的数据。仿真实验结果表明,增加用户聚类与电影标签数据能有效减小算法预测误差。
其他文献
现有的图像聚类方法以数据全局线性分布为前提,利用先验约束估计未标记数据点的低维子空间,并将其聚类到相应簇中,因此对非线性结构的数据处理存在一定缺陷。受启发于深度学
随着无线通信的快速发展,频谱资源变得愈发的紧缺。科学家研究发现,携带轨道角动量的涡旋电磁波在模式值不相等的条件下具有相互正交性,而OAM模式可取任意值,所以可将多路信
在支持视频随机访问的应用中,一个视频会被多个随机访问点划分成多个能独立解码的随机访问片段。因此视频图像的参考图像不能跨随机访问点,相似的随机访问片段之间的时域相关
通勤班车的优点很多,它可以树立企业良好的形象,发挥广告效应等,但任何事情都具有两面性,通勤班车也存在有很多的不足,比如高额的运营成本,影响正常的公交系统运行、能源浪费
随着互联网的快速发展,Web系统访问量日益升高,网络拥堵和用户访问时延问题愈发严重,现有的网络带宽已经不能很好的满足用户的服务请求。因此,数据缓存技术应运而生,缓存技术
偏振作为光的基本物理特性之一,它也可以作为信息的载体,偏振因其携带了多维参量,不仅包括所探测目标的准确信息,还能反映传输介质的内部分布特征。本论文主要利用蒙特卡洛算
重大脱轨事件与钢轨损伤密切相关,因此对在役钢轨进行定期损伤检测显得尤为重要。本文基于压电陶瓷传感器利用Lamb导向波对钢轨无损检测进行探究,通过主动激励的检测方法对钢轨有损无损状态进行辨别,同时利用反射波及时间反转等方法对损伤进行定位。首先,为了了解结构中传播信号的组成及其传播速度,利用Lamb波频散方程数值解对频散曲线进行绘制;同时,为了满足应力波信号远距离传播的要求,通过主动检测方法,利用接收
桥梁的设计要求不仅需要在静载试验下能满足相应的承载能力,在车辆动载作用下,其振动挠度也应当控制在合理的范围。过大的振动响应不仅会对桥梁结构造成损伤影响桥梁的使用寿命造成安全隐患,还会使得人们在桥梁上的行车舒适性受到影响造成心理压力,基于此本文展开了如下研究。首先文章对车桥耦合的相关基础理论进行了介绍和推导,得到了理论模型的运动微分方程,并在MATLAB中编制了数值算法对其求解,同时在ANSYS软件
自主导航技术作为航天器自主运行的关键技术之一,近年来得到了广泛的重视和发展,自主光学导航方法具有自主性强、实时性好等优点,是目前自主导航技术研究的重点。本学位论文针对导航方案设计、系统可观测性分析、状态滤波估计等问题,开展了基于图像/星光测量的航天器自主导航方法研究。论文主要研究内容介绍如下:首先,完成了基于图像/星光测量的自主光学导航方案设计。考虑航天器环境特性及导航敏感器测量特点,设计了两种图
聚类是数据挖掘中无监督学习的一项基础研究内容,它能够揭示无标签数据的内在联系。在实际应用中存在许多关于类尺寸的先验信息,然而传统聚类算法并不能很好地解决这种带有尺