基于深度学习的多模态微视频Hashtag推荐

来源 :湖南大学 | 被引量 : 0次 | 上传用户:pingerk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Hashtag的使用为网络数据的组织和检索带来了极大的便利,可以缓解数据急速增长导致的“信息过载”问题,但是网络上大部分用户都没有使用Hashtag的习惯,使得Hashtag的优越性无法得到充分体现。因此,实现Hashtag的自动化推荐具有重要研究意义。现有Hashtag推荐的研究主要集中在纯文本或文本结合图片的微博领域,针对微视频的Hashtag推荐却还未获得足够关注。近年来,微视频社交逐渐成为人们生活娱乐的主要方式,使得实现微视频Hashtag自动化推荐日益迫切。微视频作为一种多模态数据,主要包括图像模态、音频模态以及文本模态,微视频三个模态之间相辅相成,相互补充。同时,近年来深度学习技术在图像、音频、文本等各个领域的应用收获了出色的成果。因此本文以微视频多模态数据为基础,以深度学习技术为支撑,进行微视频Hashtag推荐的研究。本文的内容主要包括:
  1、针对以往Hashtag推荐工作未曾考虑数据的情感特征和Hashtag的内容/情感分类信息的不足,本文提出了一个情感特征增强下的多模态微视频Hashtag推荐模型(TOAST),模型的主要目标是提高情感类Hashtag的推荐效果,进而实现Hashtag推荐性能的整体提升。在提取了微视频各模态的内容特征和情感特征后,TOAST模型分别构建了微视频多模态数据的内容共同空间和情感共同空间,同时通过Hashtag分词引入外部知识增强Hashtag语义信息的学习,最后在进行Hashtag推荐决策时动态地捕获微视频多模态情感和多模态内容特征的不同重要性,提高推荐正确度。
  2、针对TOAST模型没有考虑用户个性化差异以及微视频不同模态重要性的不足,提出了一个微视频Hashtag个性化推荐模型(GCN-SMPHR)。该模型在微视频多模态情感共同空间和内容共同空间下通过自注意力机制动态调整微视频不同模态的重要性权重,同时通过图卷积神经网络捕获用户、微视频以及Hashtag三者间的复杂交互关系,学习用户表达,实现个性化推荐。
  3、为验证TOAST模型和GCN-SMPHR模型的有效性,本文在从Vine网站上爬取的真实数据集上进行了大量的实验,实验结果表明TOAST模型和GCN-SMPHR模型相比其各自的对比模型都取得了更好的推荐效果。考虑微视频的多模态信息、微视频的情感特征、Hashtag语义信息以及用户个性化特征确实能提高Hashtag推荐的性能。
其他文献
癌症是一种复杂的基因病,对人类健康构成严重威胁,是全球范围内的主要死亡原因之一。下一代测序技术的产生和发展,带来了多组学高通量数据,同时也为理解癌症潜在机制和实现精准医疗提供了巨大的可能。体细胞突变中只有一小部分是驱动突变,为肿瘤发展提供了选择性增长优势,大部分突变为中性的乘客突变,准确识别驱动突变对于癌症研究具有重要意义。但是,现在识别方法多数基于整个基因或单个突变位点,忽略了功能元素的中等规模
摘 要:排气系统作为重要的发动机部件,对发动机性能和噪声都有极大的影响.为提高汽车安全性和乘坐舒适性,优化排气系统的设计,根据相关设计要求对排气系统进行了强度和模态分析.首先基于CATIA软件,建立排气系统的三维模型;再用Hypemesh软件进行网格划分、简化模型、施加约束等操作,通过OptiStruct求解器对排气系统进行1 G静力分析、4 G静力分析、约束模态分析.仿真结果显示,排气系统在1
期刊
异常检测旨在从给定数据中发现那些明显偏离常规模式或表现为异常行为的数据。由于在网络入侵、医疗健康、信用欺诈、文本异常、视频监控和社会突发事件监控等领域中有着广泛应用,异常检测已成为数据挖掘的研究热点,并出现了众多异常检测算法。随着现实数据的维数越来越高,异常检测面临两个困难亟待解决:一方面,数据的高维性不仅使得异常数据难以识别,而且加剧了学习模型的复杂度;另一方面,数据维数的增加导致数据之间的欧氏距离相差很小,即高维空间中任意数据之间距离非常接近,使得数据的邻域信息难以获取。因此,如何从高维空间中有效地获
摘 要:热障涂层与冷却技术结合可以极大地提高航空涡轮发动机叶片的服役温度,而羽毛柱状结构的等离子喷涂-物理气相沉积(PS-PVD)熱障涂层因其热导率低、应变容限良好、热循环寿命长等优势备受关注.通过进行物相分析,使用扫描电子显微镜(SEM)观察热障涂层表面及截面的形貌结构;在SEM二维图像的基础上,使用图像法计算孔隙率.结果表明:通过PS-PVD设备制备出的热障涂层结晶度良好,空间点矩阵属于P/n
期刊
摘 要:以皖南山区某工程滑坡为研究对象,结合地质勘察成果,从地形地貌、地层岩性、地质构造、水文地质条件及工程施工等方面分析了滑坡的成因.基于传递系数法分别计算原地面、开挖后边坡在天然状态和饱水状态下的稳定性系数.结果表明:原地面自然边坡基本稳定;工程施工后,边坡天然状态下稳定系数Fs为1.164,基本稳定;遇暴雨或连续阴雨的饱水工况下,抗滑总力下降约6.3%,下滑总力增加约9.2%,稳定性系数Fs
期刊
高光谱图像(HSI)是由几十至几百个连续的波段信息组成,具有光谱分辨率高、纹理信息丰富等优点。其图谱合一的特性,为深度挖掘地物信息提供了有利条件,被广泛应用于资源勘探、城市规划、军事监测等不同领域。然而,在高光谱图像捕获和传输过程中,受仪器故障与大气环境等因素的干扰,导致高光谱图像被各种噪声污染,限制了后续的分析与应用性能。因此,如何有效地恢复高光谱图像是遥感图像处理领域的一个重点研究方向。高光谱
长链非编码RNA(Longnon-codingRNA,简称lncRNA)是一种拥有超过200个核苷酸并且不编码蛋白的RNA。当前lncRNA-疾病关联预测模型的局限性普遍在于:(1)数据集稀疏问题:已知lncRNA-疾病关联数据很少引起数据的稀疏问题;(2)预测精确度问题:受到已知的lncRNA-疾病的关联数据较少等问题的约束,许多预测模型的预测精确度不高;(3)孤立lncRNA相关的疾病的预测问题;(4)孤立疾病相关的lncRNA的预测问题;(5)负样本问题。
  鉴于logistic矩阵分解非常
摘 要:普通橡胶支座的健康监控通常采用定期人工检测法,需要大量人力物力,无法实现支座维护的耐久性.因此,有必要设计一种智能化支座实现对桥梁支座工作状态实时监测.通过在普通板式橡胶支座的基础上布设智能传感器,设计出一种用于监测桥梁结构工作状况的新型智能板式橡胶支座.为确认智能传感器对支座工作状态的評定作用的实效性,采用智能支座模拟实际受力状态,开展常态下轴压试验,检测支座测试钢板应力、应变数据及上顶
期刊
在大数据时代,利用车辆移动数据研究居民出行行为,有益于政府和交通管理部门制定科学合理的城市管理策略。目前大多数研究工作都集中于公共交通领域,对私家车数据的研究相对较少。本文以真实的私家车数据为基础,研究城市中私家车用户居民群体的出行行为,主要工作如下:
  为了从原始私家车数据集中获取到满足本项研究的基础数据,提出私家车数据集预处理框架对收集到的原始私家车数据集进行预处理。首先,提出以连续的几个冗余点均值替换所有冗余点的方法清洗GPS轨迹数据中的冗余数据;然后针对GPS轨迹中存在的噪声数据,通过启发
多目标优化问题在现实工程应用中非常常见,是主要研究领域之一。多目标进化算法通过维护种群,在决策空间内不断搜索以获得一组近似的Pareto最优解集,是一种处理多目标优化问题的较好的方法。本文通过对多目标优化相关理论及现有的多目标进化算法进行梳理和分析,提出了一种基于分解的Pareto前沿网格多目标进化算法,以及一种基于变量贡献目标的多种群多目标进化算法。主要研究工作如下:
  (1)基于网格的分解方法通过建立网格系统可以很好的反映解的邻居结构,比已有的分解方法表现更好,尤其是Pareto前沿不规则的多