基于蒙特卡罗优化的新闻推荐系统研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:newio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
据互联网数据中心发布的报告《数据时代2025》显示,全世界产生的数据总量已经在2018年达到33ZB,互联网数据正处于爆发式的增长阶段。人们在享受信息化社会带来的信息、资源共享利好的同时,也不得不“痛苦”的在互联网的海量数据中寻找自己感兴趣的“涓涓细流”,因而快速、准确地获得个性化信息服务这一需求也不断增长。同时,人们也更倾向于使用零散化的时间,更为被动的获取信息。而传统的使用搜索引擎、查看信息门户等手段不足以满足上述诉求,也使得更加智能的推荐系统获得了人们的青睐。实用推荐系统的设计存在两大难点,一个是真实推荐系统面临的往往是海量用户与物品间的偏好计算,线上数据需要快速“消化”,对算法时效性和数据的处理能力要求较高。另一个是完善的用户偏好需要结合多种来源的数据共同分析,在保证算法性能的基础上对多源数据进行有效利用、实现互补缺漏是有难度的。在本次基于蒙特卡罗优化的新闻推荐系统研究与实现中,针对新闻推荐数据的特点设计了混合推荐模型,利用多源数据,多角度的对用户偏好进行刻画,并用兴趣模型分析了用户兴趣随时间的演变进程,提高了推荐击中率。在算法性能优化方面,参考了蒙特卡罗抽样方法设计了系统的召回策略,一定程度上降低了数据规模对算法时间开销造成的影响,从而解决了实用推荐系统的设计的两大难点。采用蒙特卡罗策略对推荐系统的算法性能进行优化是推荐系统领域一次有意义的尝试,在实验中也证实了提出的算法在推荐击中率和时间开销两方面带来了收益。相信随着个性化的推荐服务所使用的数据规模和数据来源的日益增长,诸如蒙特卡罗抽样等更多有关推荐算法开销问题的解决方案会涌现出来,本次实践也会给后续相关问题的研究和解决带来启示,具有一定的借鉴意义。
其他文献
参数估计作为阵列信号处理技术中的一个重要分支,在现代声呐和雷达的定位通信领域中发挥着重要作用。其中的多参数估计技术是更加贴合实际的问题,可以对目标信号进行更加全面完整地描述,而目标的波达方位估计和时延估计是对目标进行定位的两个重要参数,也是本文的主要研究内容。本文以阵列接收水下多途信号为研究对象,采用反卷积算法利用多途信号声程和到达角度的差异对时空二维做高分辨的时延-角度联合估计,并通过仿真分析和
随着物联网的快速发展,作为物联网应用的一部分,水下传感网络在海洋勘探和水环境监测应用等领域具有极高的研究价值。由于水下环境复杂,传感器节点有限,水下充电极其困难。因此,降低水下传感网络能耗、提高网络传输效率成为关键问题。路由协议决定数据包要遵循的路径,良好的路由协议不仅能够降低网络能耗,提高网络效率,还可以增强数据传输的可靠性。因此,设计高效的水下传感网络路由协议变得极其重要。本文围绕水下传感网络
随着人工智能的兴起,机器人技术不断的发展,无人驾驶技术已经成为全球研究热点。无人驾驶技术主要利用摄像机、激光雷达、定位惯导系统(IMU)等传感器实现对周围环境的实时感知。而目标检测与跟踪是自主车辆环境感知的重要内容,也是自动驾驶车辆路径规划和决策的重要依据。目前,障碍物检测和目标跟踪算法主要应用在视觉摄像头和3DLidar上。虽然利用视觉作为无人驾驶的主要传感器进行障碍物检测和跟踪的方法是目前的主
随着铁路事业不断发展,列车在经济和社会生活中越来越重要。列车行车安全也成为铁路工作的重中之重。列车运行过程中,驾驶员扮演着重要角色,现阶段对驾驶员安全驾驶的监管仍依赖于人工事后查阅,效率较为低下。本文以此为背景,使用计算机视觉技术对驾驶员行为进行识别和分析,识别结果可用于驾驶员行为的监管,以此实现驾驶员行为监管的智能化。论文主要研究内容如下:(1)驾驶员监控视频图像增强。本文使用了改进的Retin
近年来,面对复杂严峻的国际环境和艰巨繁重的改革发展稳定任务,我国国家经济仍取得了较为快速的发展,居民个人收入有明显提高。居民收入的增长提高了个人所得税的收入,同时也为个人所得税的征收管理带来了新的机遇与挑战。国地税合并后,个人所得税的征收管理过程中面临着一些新问题,个税改革让更多纳税人涉及其中,这样的新形势下,对于个人所得税征收管理的研究就变得很有实际意义。哈尔滨市松北区作为哈尔滨新区的核心承载区
束鹿凹陷位于冀中坳陷南缘,是宁晋凸起和新河凸起之间的一个东断西超的单断箕状凹陷。束鹿凹陷面积小、丰度相对低、资源转化率低,勘探潜力较大。束鹿凹陷古近系地层以砂泥岩互层沉积为主,形成良好的储盖组合,以构造油气藏勘探为主,但受到层位解释不准确,部分存在窜轴现象以及缺乏断裂系统划分的影响,制约了其构造油气藏的勘探精度;同时,由于潜山顶面坡积砾岩的存在,一方面有利于潜山油气保存,另一方面增加潜山顶面识别难
近年来,微流控技术在肿瘤细胞富集方面得到了广泛关注。在已有的研究中,微流控通道截面受限于简单的几何形状,对微流控通道内流场的研究带来很大的局限性。本研究受自然界中河流弯道截面的启发,提出一种3D打印类河弯截面微流控通道,用于基于尺寸的粒子聚焦和富集。本研究设计了参数不同的微流控通道截面,基于速度场和旋度场仿真结果,发现顶点长度为1000μm时,通道截面上产生的涡旋中心最靠近通道外壁,从而为粒子的受
油酰乙醇胺(OEA)是一种内源性的PPAR-α高亲和性配体,因其安全、高效、低副作用的特点,有望成为新一代抗肥胖药物。文献报道的OEA合成路线大多反应条件不温和、需色谱分离、生产周期长、三废多、不经济。针对这一现状,本文开发了一条绿色、温和、高效的OEA合成工艺,优化的反应条件为:甲醇钠用量为油酸乙酯质量的6%,油酸乙酯与乙醇胺的摩尔比为1:7.5,反应温度为室温,反应时间为2h。粗品经乙酸乙酯重
近年来,金融市场动荡不断,“黑天鹅”事件接连发生,使得金融风险的国际性传染呈现出常态化、迅速化、短期化的特征,金融市场的波动性受到普遍关注。本文基于波动率指数,研究金融风险在世界五个主要金融市场——中国上海、中国香港、美国、欧洲、日本间传染的相依结构、强度和方向,并在此基础上,提出有助于提升我国的国际金融风险管理水平的建议。在藤Copula模型的构建中,本文采用ARMA-GARCH-偏t模型作为边
近年来全球极端干旱频发,给社会经济和人民生活带来严重影响。中国由于地处东亚季风区,干旱频繁,受到社会各界广泛关注。前人研究表明,中国东部的干旱由气候系统内部变率和外部强迫主导。而火山外强迫与内部变率线性叠加能够加剧干旱。然而,不同干旱时期火山喷发以及不同强度火山喷发对干旱的影响是否存在差异,历史时期是否存在内部变率与火山外强迫共同影响的干旱?这些问题尚未得到解决。因此,本文基于通用全球模式(Com