基于深度学习的视频分类方法研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:candycandy726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了有效管理视频数据和提取视频中的重要信息,视频自动分类技术成为解决这一问题的主要途径。视频数据由图像帧组成,其内部信息的关系结构比较复杂,基于传统手工设计的特征不能有效的表示视频数据中的复杂信息。利用深度学习技术能够提取较为完整的特征信息,提高视频分类的准确率。因此,本文研究了基于深度学习的视频分类方法,主要工作如下:(1)针对定长的视频序列不能完全覆盖视频全部动作信息的问题,提出了基于三维卷积神经网络的特征融合的视频分类方法。该方法在三维卷积网络模型的基础上,提取不同时间尺度的视频帧序列特征,并对全连接层的特征进行加权融合。在数据集UCF101上对不同的融合方法进行比较,实验结果表明,后端加权融合方法的视频分类准确率较高;然后经过实验确定加权融合的参数,从而构建了不同尺度特征融合的视频分类网络模型。实验结果表明,本方法比主流方法更有效的进行视频分类。(2)针对视频语义变化对视频分类结果的影响以及如何提高视频分类过程中类内相似度和类间离散度等问题,提出了一种基于深度度量学习的多路卷积网络视频分类方法。该方法基于不同尺度特征融合的网络模型,设计了一种多路卷积视频分类网络。为了使网络能够学习类内相似度和类间离散度,在度量学习结构中提出了基于负向样本对语义距离的间隔分配函数,使网络更加注重难分样本。在训练时同时进行度量学习和分类任务。实验结果表明,本方法能够提高视频分类的准确率。(3)为了使分类结果的准确率进一步提高,提出了一种基于多路卷积网络与LSTM的视频分类方法。该方法基于多路卷积网络的模型对视频图像的空间特征进行提取;然后采用LSTM模型进一步得到具有时间动态信息的特征,从而获取了更多视频时序性特征;最后,通过Softmax分类器输出分类的结果以及分类准确率。实验结果表明,本方法能够进一步提高分类的准确率。
其他文献
互联网泡沫已经破灭了,曾经热得有点狂热的国内互联网市场在迅速地冷却.几乎所有的国内企业,不管是借着热潮已经抢先触网的,还是没有来得及抢上网络头班车的都在反思.有人反
作为世界名表中的青春力量,SWATCH手表以其时髦缤纷的色彩、活泼的设计以及颠覆传统的造型,为时间传递出前所未有的思维。如今,风格独具的SWATCH手表已在全球各地销售出超过数百
大学章程,是规律性与差异性的统一。这是因为,首先大学章程制定的制度依据存在共性;其次,高校办学与运行的客观规律存在共性,所面对的外部环境具有普遍的时代性。各高校章程存在的
1985年4月,日本出现第一台袖珍计算机之后,以轻、薄、小为设计理念的电子产品开始充斥我们的生产和生活。伴随着这些高科技的产品,企业旧有的信息管理方式开始发生转变,传统
<正> 随着并行工程(CE)的不断实施,基于约束的并行产品设计方法已成为当前研究的热点。然而,此方法极大地受制于如何表达和处理大量错综复杂的约束关系这一&#39;瓶颈&#39;问
梅特勒-托利多仪器(上海)有限公司(以下简称梅特勒)是全球最大的衡器及分析仪器制造商--瑞士梅特勒-托利多集团于1992年在上海漕河泾开发区成立的独资公司,主要从事各类电子
展讯通信日前发布了TD—SCDMA/HSDPA/EDGE/GPRS/GSM单芯片射频收发器QS3200。该产品是继GSM/GPRS单芯片射频收发器QSSOO系列及GSM/GPRS/EDGE单芯片射频收发器QS1000系列后,展讯研发成
<正> 非典过后,网上消费依然强劲,但是信用危机始终是一个令电子商务网站头疼的问题。据了解,同一时期网上购物的投诉量也有所上升,如何赢得消费者的信任成为电子商务网站持
目前,国家药监局、公安部联合打击制售假劣药品、医疗器械违法犯罪行为的专项行动已在全国推开。此次行动是国家药监局组建以来首次与公安部联合开展的大规模打假行动。就此,
目的测定黑线姬鼠对抗凝血灭鼠剂溴敌隆的敏感性,为检验该鼠的抗药性提供参数。方法实验室做单个笼养无选择摄食试验:雌雄分开,随机分组,按7个不同食毒期供给浓度为0.0005%的溴敌隆