一种融合信息网络结构的数据增强行为预测算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:yww74
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网上用户移动数据的日益繁荣,用户的移动行为预测也成为了预测研究的热点.近年来,循环神经网络(RNN)技术因其高效性和扩展性在移动预测中得到了广泛的应用.但是,目前大部分网上收集到的用户移动行为数据普遍具有稀疏和异质的特性,特别是当用户出于习惯或隐私考虑可能会拒绝向平台提交活动记录.因此在这些稀疏数据集上基于RNN的预测技术无法有效地学习到足够的用户行为特征,从而影响了模型的预测性能.为了解决该问题,本文提出了一种融合信息网络结构的数据增强行为预测算法.具体来说,首先我们将用户历史行为数据转为信息网络图;然后通过该信息网络的模块度来评估用户的信息传递效率;最后根据信息传递效率对用户的朋友数据进行采样,将具有高信息传递效率的朋友数据嵌入到用户数据中对用户数据进行增强.在真实数据集Yelp上的实验结果显示,我们的方法可以起到对现有算法模型增强的作用,所有模型的预测性能都得到了大幅提升.
其他文献
基于深度强化学习(Reinforcement Learning,RL)的知识推理旨在推理缺失事实并补全知识图谱,RL智能体在知识图谱上搜索路径,并基于路径进行事实预测和链接预测.由于具有良好的性能和可解释性,基于深度RL的知识推理方法近几年迅速成为研究热点.然而,对于特定实体来说,动作空间中存在大量的无效动作,RL智能体常常会因选择无效动作而终止游走,所以路径挖掘的成功率很低.为了解决无效动作的问题,本文提出一种基于深度迁移强化学习的知识推理方法—TransPath,在目标任务之外增加了单步游走选择有效动
本文阐述了一种应用于大规模数据节点划分的改进网格密度峰值聚类算法.针对传统的密度峰值聚类算法距离矩阵计算时间长,人工选取阈值对聚类结果的影响较大,限制其在大规模数据集中的应用等缺点,本文采用基于自适应网格划分的密度峰值聚类,通过判断网格均衡来计算网格间距离,引入万有引力得到网格相对引力,通过极大值平均选取法自动得到密度与引力阈值.经过不同数据集的对比实验,本文提出的大规模节点划分算法在保证算法准确度的同时,其执行速度最高约提升了77%,由轮廓系数评估的聚类质量稳定在0.42左右.
针对现有5G系统主同步信号同步算法在大频偏情况下的同步性能较差的问题,本文提出一种基于快速傅里叶变换(Fast Fourier Transform,FFT)的联合检测算法,通过对传统互相关算法中的共轭相乘结果进行FFT变换,记录变换后的峰值,遍历所有峰值找到同步点,得出小区组内号,再进行载波频偏的估计.仿真结果及复杂度分析表明,改进算法不仅具有很强的抗频偏能力,尤其对于大频偏下的情况,同时完成载波频偏的估计,所增加复杂度在可接受范围内且检测性能稳定.
传统的地址匹配方法往往难以胜任中文地址匹配问题.首先,每个中文单字都是独立整体,在纠错上难度大于英文,其次中文地址体系结构复杂,缺乏一个统一的标准.本文结合生物信息领域的序列比对思想,提出了一种基于动态规划的中文地址匹配方法.该方法将中文单字看成字符单元,对中文地址进行序列化,改进Smith-waterman算法进行序列匹配.针对中文的单字特点,统计区分文字的重要性差异,构建非均权打分策略;引入空分罚分策略,解决错误匹配及其过度拟合问题;使用排序均一化策略,优化了排序效率,增加了结果集的多样性.最后,将本
针对传统的过采样算法中决策边界模糊以及噪声样本分布问题,本文提出一种基于概率密度函数与自适应过采样算法.首先将少数类样本分为安全样本、边界样本、噪声样本;然后采用瑞利分布(Rayleigh Distribution),对安全样本及边界样本进行采样操作,利用其概率密度函数对新样本的分布密度进行构造,以此达到平衡数据集的目的 ;最后使用随机森林作为分类器,并进行网格搜索(Gridsearch)进行参数寻优.实验结果将所提出的方法与4种代表性算法在10个不均衡数据集上进行了比较,验证了该算法的有效性.
随着互联网的发展,全球数据量爆炸式增长,信息过载现象严重,如何获取用户真正关注的信息成为困扰人们的难题之一.在此背景下,推荐算法在各个领域得到了广泛应用.本文首先介绍了目前主流推荐算法的分类方法和主要评价指标.其次,分别介绍了当前各类推荐算法的研究进展,其中包括传统推荐算法的基础推荐原理和研究进展以及神经网络在推荐算法中的研究应用,对其进行归纳总结.同时分析了数据稀疏性、冷启动和可伸缩性等推荐算法常见问题.最后,提出了现有推荐算法的不足以及在应用中遇到的部分问题,介绍了未来推荐算法的研究热点.
哈希检索具有存储消耗低、查询速度快等优点,被广泛应用于跨模态检索研究,其中基于深度学习的跨模态哈希方法是热点研究问题.大多数深度哈希方法通常在多模态数据的特征关联性学习过程中忽略了数据内容的潜在相关性和语义判别性,从而导致哈希码的关联性不强,容易造成原始数据特征和神经网络特征的不兼容问题.针对以上问题,本文提出一种图像-文本深度联合语义哈希算法(Deep Joint-Semantic Hashing,DJSH).该方法使用两个神经网络分别提取图像和文本的细粒度特征,并为每个模态网络设计了哈希层和标签层,分
生成对抗网络(Generative Adversarial Nets)是一种融合了生成学习和对抗学习的无监督学习方法,以零和博弈作为核心思想,其组件通过互相对抗不断地提升模型效果.将GAN模型融入到推荐领域中,可有效缓解数据稀疏性问题,提高推荐效果.本文从模型输入的是隐式反馈信息或显式反馈信息两个方面对基于GAN的个性化推荐模型进行了分析;探讨了基于GAN的个性化推荐研究已取得的相关成果,指出了现有GAN推荐研究在稳定性较差、缺少通用优化方法、模型复杂度较高、缺少通用评测指标等方面的不足;并从提高模型稳定
各种类型的深度神经网络模型已被应用到时序分析中,但基于频域的神经网络与时域的线性模型融合仍然缺乏有效的模型.提出一种基于多级小波分解的深度网络和差分自回归移动平均模型相融合的方法(mWDLNet),时序信号经小波分解到频域,由卷积神经网络和长短期记忆网络提取时序信号的空间和时间维度特征,同时利用差分自回归移动平均模型(ARI-MA)解决神经网络模型的尺度不敏感问题,最后融合两部分的输出结果,提高了预测的准确性.并通过实验验证了mWDLNet模型添加小波分解、卷积模块以及融合线性预测的有效性.将提出的模型应
传统的兴趣点推荐通常忽略了用户签到行为中序列模式的重要性,且无法有效地捕捉用户复杂且动态变化的兴趣偏好.由此,本文提出了一种用户偏好和时间序列的兴趣点推荐模型(User Preference&Time Sequence based POI Recommenda-tion,UPTS-PRec).该模型能够分别对短期偏好和长期偏好建模并融合,以捕捉用户兴趣的变化.对于短期偏好,提出了融合时空上下文信息的长短期记忆网络来学习用户签到行为中复杂的序列转移模式,并通过基于目标的注意力机制进一步精确地提取短期偏好.对