【摘 要】
:
点击率(Click-Through-Rate,简写为CTR))预估是通过获取用户与待点击对象的特征及交互数据,分析用户是否会对这一点击对象产生点击行为。CTR预估的应用场景广泛,在电子商务、推荐系统等热门领域内均被视为核心问题,也展现出了巨大的商业价值。CTR预估的主要挑战来源于:在实际业务场景中,信息内容的特征具有高度稀疏和特征来源广泛的特点,这导致传统分类问题的解决策略在CTR预估问题上难以保
论文部分内容阅读
点击率(Click-Through-Rate,简写为CTR))预估是通过获取用户与待点击对象的特征及交互数据,分析用户是否会对这一点击对象产生点击行为。CTR预估的应用场景广泛,在电子商务、推荐系统等热门领域内均被视为核心问题,也展现出了巨大的商业价值。CTR预估的主要挑战来源于:在实际业务场景中,信息内容的特征具有高度稀疏和特征来源广泛的特点,这导致传统分类问题的解决策略在CTR预估问题上难以保证效率和精确度。近年来,对特征之间的关联性研究和自适应特征提取已成为深度学习领域的热点问题,这为CTR预估问题的研究也提供了新的思路。本文通过对CTR预测机制展开研究,在CTR预估问题解决流程中的特征处理这一环节上进行了优化,结合聚类算法、卷积神经网络等技术,提出了两种自适应特征提取模型。模型一通过聚类算法对样本之间进行关联性的计算,并借助树结构完成自适应特征的生成;模型二借助卷积神经网络对局部特征进行关联性的计算,再捕获全局特征并输出自适应特征。此外,两种模型生成的新特征还将与原始特征结合,输入至分类模型,从而实现一套完整的点击率预估机制。为了验证本文所提模型的有效性,我们采用多种分类预测模型,包括逻辑回归(LR)、因子分解机(FM)、梯度提升回归树(GBDT)、多层感知机(MLP),在两组公共数据集上,包括MovieLens、Cretio,对比加入所提特征前后两种情况的预测性能。其结果显示本文提出的两种特征提取模型均能够提取到关键信息并生成为预测结果带来提升的自适应特征。具体地,本文主要工作如下:(1)基于聚类算法和树结构研究了一种自适应的特征提取模型。使用聚类算法对特征之间的关联性进行计算,然后根据样本之间的关联性生成一棵树,通过制定编码规则从该自适应生成的树中提取出新特征。(2)借助卷积神经网络提出了一种自适应特征提取模型。通过卷积神经网络完成对相邻特征之间的高阶交叉计算和全局特征的捕获并输出,从而完成自适应特征的生成。(3)将原始特征与本文所研究的自适应特征结合作为输入,传入分类预测模型,形成一套完整的CTR预测机制。(4)为了评估本文所提出的两种自适应特征提取技术,在实验部分我们采用多个分类模型,包括LR、FM、GBDT和MLP,在两组开源数据集上,包括MovieLens数据集和Cretio数据集,分别计算加入这些特征前后两种输入的性能。此外,本文对所提模型的关键参数的敏感性也进行了分析。
其他文献
进入20世纪以后,工业生产模式和现代化带来的环境风险正在对人类和生态系统造成威胁,并逐渐成为影响经济发展与社会稳定的关键性因素。人类寻求安全的本能迫切地要求在获得发展的同时,通过制度来规范环境风险行为,并且对其所造成的损害进行合理的分配和缓解。这一要求促成了民法与环境法的互动,产生和发展了环境侵权制度。环境侵权归责原则作为分配损害的基础,对其进行考察,可以发现其在立法规定和司法实践中存在相互矛盾、
本文针对工程项目研究中出现的基于深度学习的电机故障诊断面临的电机参数变化引起的故障识别准确度下降问题与小样本问题进行研究,提出了一种基于深度迁移学习的电机故障诊断方法来缓解这两个问题。在使用深度学习方法对电机进行故障诊断时通常会出现实际使用精度比实验精度下降的情况,其主要原因为电机各个参数之间互相耦合,电机在使用过程中由于各种原因其参数偏离其初始值,实际采样数据与神经网络模型训练数据分布差异变大,
在全球信息化的背景下,在线教育顺应时代潮流,向着更方便更智能的方向蓬勃发展。将人工智能与在线监考相结合,更加精准、高效地完善防作弊措施也成为推行在线教育亟待解决的难题,对于考试中利用手机、书本、耳机等物品进行作弊的现象也一直都没有解决。在考试系统的监考环节加入对违规物品的检测将对解决考生作弊的问题提供新的方案,对为维护考试的公正与对考生真正实力的评估具有重要意义。本文以在线考试系统的监考环节为研究
汽车作为交通工具为人类的货运和出行提供了动力,同时也带动了经济的飞速发展,成为国家的支柱产业。汽车悬架系统作为车辆的重要组成部分,是将车轮连接至车架的一组机械组件。它对于车辆的操控性,稳定性和舒适性具有重要的影响,同时是保证行驶安全的重要部件。磁流变液作为智能材料,具有可控性高,控制速度快,阻尼力输出范围大等优点,可以为半主动悬架系统提供阻尼。相较于被动悬架可以更好的调节悬架的参数,从而适应路面的
电流互感器是电力系统保护和计量的关键设备,运行过程中容易因为注油孔挡圈内部锈蚀等原因造成主绝缘受潮,给人身和电网安全运行带来巨大威胁。由于检测油样取自电流互感器底部取油阀,目前常用的电流互感器内部微水含量检测法难以全面反映电流互感器内部不同位置处微水含量的变化及分布规律。因此,本文研究一种运行状态下电流互感器内部微水含量动态推演方法,有助于准确掌握电流互感器绝缘状态,具有重要的理论和实用价值。论文
基于平面传声器阵列测量的二维压缩波束形成是一种具有广阔前景的声源识别方法。早先提出的定网格在网压缩波束形成假设声源落在预设为基的固定网格点上,当声源未落在网格点上时,声源真实的基与预设的基不匹配,声源识别性能劣化,出现基不匹配问题。新近提出的二维无网格压缩波束形成方法虽能从根本上解决基不匹配问题,但亦存在两个不足:一是现有方法需要噪声先验参数,二是阵列形式仅限于矩形网格阵列及稀疏矩形网格阵列。上述
如今,以大数据为驱动的个性化商业推荐系统已经在Amazon、e Bay等大型互联网公司中广泛应用,他们的主要目的是利用推荐系统最大化公司利润,这与推荐准确性、推荐物品的利润值及长尾物品的曝光率均密切相关。然而,传统的推荐算法及目前的基于进化算法的多目标推荐算法都只考虑了用户侧的使用体验,却未考虑公司最关心的利润需求。另外,现存基于进化算法的多目标推荐算法存在后期超体积波动和时间开销过大的问题。针对
人脸识别是计算机视觉领域的热门研究课题之一,与我们的生活密切相关,在安防监控、电子消费等多个领域都有着广泛的应用。一方面,在日常生活中,人脸容易出现不同程度的遮挡,而遮挡引起的人脸特征缺失、对准误差及局部相干等问题,导致面向局部遮挡的人脸识别算法仍存在一些不足;另一方面,基于深度学习的人脸识别模型层数越做越深,模型的参数与计算量也越来越大,在计算能力和存储空间都受限的小型或者移动设备上难以得到实际
缺陷检测是保证工业铸件质量的重要环节之一,能降低由缺陷所引起的安全风险。数字化X射线成像(Digital Radiography,DR)技术作为一种常用的工业无损检测技术,是一种有效的工业铸件缺陷检测手段。目前,在工业上对DR图像的缺陷检测方法主要为人工目视检测法。该方法不仅耗时费力、容易让人产生疲劳,而且很大程度上依赖于检测人员的主观判断,不利于检测数据庞大的DR图像数据集。因此,采用自动化检测
薄壁构件力学特性与实体截面杆件有所不同,其失稳问题复杂而多变。薄壁杆件的基本屈曲模态可分为整体屈曲、局部屈曲和畸变屈曲,有时剪切和横向伸缩变形亦不可忽略。薄壁构件不同模式失稳的屈曲机理差异显著,而缺陷、屈曲后、材料弹塑性等因素对不同失稳模式的影响方式和作用效果也各不相同,因此对整体、局部、畸变等基本屈曲模式的界定尤为必要。目前对于薄壁杆件失稳模态研究的主要方法有:广义梁理论、约束有限条法和约束有限