基于集成学习方法的点击率预估模型研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:lxj5186101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于互联网中积累的广告日志具有数据稀疏、特征量大、正负样本分布极其不均匀等问题,使得人工特征提取费时费力,并且单一预测模型很难得到更好的预测性能。针对这些问题,提出梯度提升树GBDT和Stacking相融合的点击率预测模型GBDT-Stacking。通过引入梯度提升树自动进行特征提取与构造,并结合Stacking集成模型对在线广告点击率进行预测,有效提高了单个预测模型的性能。在真实广告数据集上的实验结果表明,GBDT-Stacking集成模型比对比模型在AUC的取值上至少提升了4%。
其他文献
为保证含风电电力系统的安全稳定与经济运行,构建了以最小化系统运行成本为目标的旋转备用容量优化调度模型。为提升模型的求解运算速度,提出一种改进的模拟植物生长算法对模
本文以探空站和自动站实测资料为检验参考,通过主客观检验GRAPES和WRF模式在西南地区的初始分析场和预报场,一定程度揭示出模式在西南地区的初值质量、动力框架性能和降水参数
东亚地区蕴含着复杂的竞合关系,由这一地区特殊的历史文化传统和复杂的现实权力结构共同塑造出一种利于处理彼此关系、促进强弱互利共存的"共生秩序"。在共生秩序下,不同类型权
随着中国对外交流不断加深,口译活动越来越频繁。对口译的研究有助于提升口译质量,促进中外交流。其中,“研究译员主体性能让我们更好理解口译运作过程”。所谓主体性是指主