【摘 要】
:
随着现代科技的飞速发展,社交媒体功能不断更新迭代,如Twitter,Facebook,微博等社交平台都支持用户发布多媒体信息。研究表明多数用户更倾向于选择利用图像与文本两种媒体进行信息发布,利用文字搭配情感图片,表达发送者情感情绪状态。因此,利用文本和图像的跨模态社交媒体数据进行情感分析,有利于如用户兴趣分析进而定向推荐,群体情感倾向分析进行舆情分析等,其研究成果具有潜在的应用前景。跨模态社交媒体
论文部分内容阅读
随着现代科技的飞速发展,社交媒体功能不断更新迭代,如Twitter,Facebook,微博等社交平台都支持用户发布多媒体信息。研究表明多数用户更倾向于选择利用图像与文本两种媒体进行信息发布,利用文字搭配情感图片,表达发送者情感情绪状态。因此,利用文本和图像的跨模态社交媒体数据进行情感分析,有利于如用户兴趣分析进而定向推荐,群体情感倾向分析进行舆情分析等,其研究成果具有潜在的应用前景。跨模态社交媒体情感分析是近年来发展起来的研究方向,特别是基于深度学习的研究方法逐渐取得了一定成果,然而目前研究尚存在以下难题,第一、缺少大规模的、开放的、标记良好的图文情感分析数据集;第二、现有图文情感分析更关注于利用深度学习方法提取文本特征和视觉特征,并没有关注到对多种模态数据进行特征对齐的重要性;第三、由于模态的异构特点,如何高效地将两种模态的特征融合成全局特征表示,是图文情感分类的研究重点和难点之一。考虑到现有的跨模态特征融合方法多采用将两种模态特征进行元素拼接、相加或者相乘的方式,未考虑特征融合中不同模态之间深层的关联关系,研究利用跨模态关系指导的有效特征融合方法仍是一个具有挑战性问题。因此,本文针对跨模态情感研究中,图文情感分析数据集,跨模态特征对齐和跨模态特征融合方法三个问题进行研究。主要内容和创新点如下:1、完成了图文情感分析数据集的构建及预处理。首先,利用Senti Word Net情感字典设置一个具有强烈积极情感关键字和消极情感关键字的关键字列表。然后,以网络爬虫为基础,通过Filckr API,用积极和消极关键词列表查询Flickr网站数据,构建了Flickr图文情感分析数据集。其中,积极情感倾向样本量为43452,消极情感倾向样本量为43187。将得到的图像数据使用Open CV统一图片尺寸大小,进行归一化处理。对于文本数据,使用标准停用词列表删除停用词和标点符号,将文本向量数值化方便后续实验使用。将预处理之后的数据集进行划分,80%用于训练,10%用于验证和10%用于测试。2、提出一种利用文本注意力机制进行文本与图像特征对齐的情感分析方法。在构建图像和文本双通道融合情感分析深度学习框架基础上,针对图像和文本两种模态特征之间的对齐问题,考虑到文本情感信息相对图像具有更显著的特点,以文本信息指导图像特征的提取,提出了att-LSTM(attention-LSTM)模型,利用文本注意力机制进行跨模态数据的特征对齐,实现视觉特征与文本特征之间的情感信息互补,最大化文本与图像的相关性,减少语义鸿沟。所提出的att-LSTM模型结合卷积神经网络(CNN)和长短时记忆网络(LSTM)的优势,使用VGG-19(Visual Geometry Group Network-19)作为图像子网络,对图像信息进行微调,提取图像特征;利用LSTM作为文本子网络提取文本特征;拼接两种模态特征生成全局表示,使用softmax算法进行情感分类。在所构建的Flickr图文情感分析数据集上进行实验验证,结果表明,相对多种主流图文情感分析模型,所提出的att-LSTM模型取得了更好的分类结果,预测情感倾向的准确率达到82.7%。3、提出一种基于双线性融合和Tucker分解的跨模态图文特征融合方法(Bilinear Tucker Fusion,BTF)。在基于文本注意力机制指导的文本和图像特征提取基础上,针对所提取视觉和文本情感特征的融合问题,提出了利用双线性算子进行图文特征融合计算,考虑到双线性模型融合特征维度高,分类计算代价大问题,利用Tucker分解方法进行降维计算。基于视觉和文本特征的双线性融合模型实现了文本信息和视觉信息之间高层次关联学习,使用Tucker张量分解,在降低融合特征参数维度基础上,进一步参数化双线性相互作用,提升了图文结合的跨模态情感分类性能。在Flickr图文情感分析数据集上进行验证,实验表明BTF模型预测情感倾向的准确率达到84.5%,与使用元素拼接、相乘、相加的特征融合方式为基础的情感分析基准模型,以及主流图文情感分析方法进行比较,都取得了更好的分类结果。
其他文献
文化的交流与碰撞对乡土景观有着潜移默化的影响,在乡土景观设计中面对多元文化与地域文化的碰撞,如何将多元文化弃取、吸纳、变通、消化运用于乡土景观设计中,怎样做才能让
钠离子电池由于具有资源优势,有望成为新一代的能源储存体系,因此发展具有良好电化学性能的正负极材料对于钠离子电池的规模化应用有着非常重要的意义。在众多的电极材料中,导电聚合物由于自身的导电性、结构可设计性和独特的氧化还原性,作为电极材料被广泛地进行了研究。其中聚苯胺导电聚合物(PANI)具有高比容量(296 mAh g-1)、良好导电性、易制备和低成本的特点,同时其高温热解可以制备用于负极的碳材料,
本研究主要分析部编版初中语文教材中古诗文注释部分出现的动植物词语。着重分析教材里古诗文中动植物注释的意象性,探讨动植物注释中部分存在的注释内容当注未注、不当注而注、注释不严密以及注释重出等问题,同时研究动植物的注释原则。希望对教材注释体系的完善和提高有一定参考意义。当下,学术界单独研究动植物意象的论文较为常见,但针对现行部编版初中语文教材古诗文中的动植物注释研究基本没有。笔者将部编版初中语文教材古
随着我国电力体制改革的推进,各地将逐步建立起电力现货市场。但由于电力商品的特殊性(供需瞬时平衡且不能大规模储存),电力现货市场价格波动很大,电力企业的经营面临巨大的风险。电力市场参与者需要能有效规避未来价格风险的管理工具,而电力金融市场具有价格发现、套期保值等功能,故建立电力金融市场是电力体制改革深化的必然选择。有效是市场设计的前提,电力金融市场有效性关乎到相关功能的发挥。因此,在电力现货市场不断
坭兴陶作为历史悠久的传统材料,具备绿色天然、耐酸碱、泥质细腻易加工等优良特性,是制作饮食用具、家居用具等日用品的优质材料。随着时代的发展,坭兴陶日用产品发展遭遇瓶颈,部分生产企业脱离现代用户使用需求的盲目生产,知识产权意识淡薄导致产品同质化严重。现阶段,坭兴陶日用品在功能及形制上,已无法满足现代消费者日益丰富的多元化需求。时至今日,温控技术在日用陶瓷产品领域的运用日渐增多,以现代用户多元化需求为导
少数民族题材在工笔人物画的创作中具有一定的重要性,占据绘画领域中较大的比例,也是当代绘画创作研究的主要方向之一。中国传统工笔人物画在绘画技法精神和表现方面都具有无限可能,绮丽跳跃的颜色,精美丰富的纹饰,充分的满足了工笔人物画创作的装饰性需求,由此可见以少数民族为表现题材的工笔人物画必然会成为艺术长廊中最闪耀的一颗明珠。这篇论文是我在研究生期间,根据自己的学习与探究少数民族题材的工笔人物画创作体会与
随着国内外高校间的交流,高校实验中心逐渐作为对外连接的重要窗口。作为一份程序性文件,高校实验中心的“质量手册”定义了实验中心的质量管理体系。本翻译实践报告内容选取自天津大学现代连接技术实验中心《质量手册》,包括实验中心简介、组织、管理体系以及文件控制四条目录下的内容。天津大学现代连接技术实验中心《质量手册》属于信息型文本,规定实验中心的检测准则,提供检测标准,其特征在于客观地表达要传达的信息。首先
随着电机驱动技术的快速发展,高速电机在工业中得到了越来越广泛的应用,同时,对变频供电条件下高速电机能效水平要求也越来越高。高频供电时的谐波以及由此带来的损耗问题成为高速电机设计时关注的热点。本文针对这一问题,主要开展用于降低高速电机损耗的低谐波绕组设计研究,主要研究工作如下:1)分析了变频器供电带来的谐波特点及其对电机内部空间谐波的影响;并计算分析了电机内部空间和时间谐波的特点;介绍了基于时步有限
随着电力系统智能化的推进,作为电网安全稳定运行三大支柱之一的电力通信网络在电力系统中扮演着越来越重要的角色。电力通信网的安全运行和数据可靠传输直接影响到电力安全生产业务的有序开展,并会对电力系统资源的高效利用产生深远影响。为此,论文基于历史运行统计数据对电力通信网进行多业务风险评估具有重要的理论意义和实际价值。本文通过分析某省电力通信网的年度统计数据,归纳出其电力通信网中主要承载业务的分布情况和业
当前的市场和顾客要求半导体分立器件封装测试企业交付零缺陷的半导体分立器件,但是目前半导体分立器件制造企业的质量水平无法满足客户日益提高的质量要求。不论是在分立器