基于红外视频分析的行为识别方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:E200902027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为识别是计算机视觉领域一个重要的研究课题,有着十分广泛的应用前景。然而,目前大部分行为识别研究都是基于可见光视频,基于红外视频分析的研究还相对较少。针对这一问题,本文围绕着红外视频分析展开行为识别方法研究:首先构建了一个红外行为识别数据集;然后采用了多种特征评估方法对这个数据集进行评估;最后针对红外视频的特性,提出了一种改进的基于双通道卷积神经网络的行为识别方法。具体研究工作如下:基于对现有常用可见光数据集的充分调研,本文参考通用的数据集构建方法构建了一个新的红外行为识别(Infared Action Recognition,InfAR)视频数据集。该数据集中所有的红外视频均在真实场景中录制而成,总共包含了12种日常行为。同时,拍摄时还考虑了背景、遮挡、视角以及季节变化等因素。基于构建的红外数据集,本文从低层描述子、前后期融合、成像因素三个方面展开了评估。这里总共选取了10种不同的低层描述子,并使用了三种编码方法,同时也测试了两种核函数。实验结果表明密集轨迹(Dense Trajectory)特征能够取得较高的识别精度(68%),而梯度方向直方图(Histogram of Oriented Gradients,HOG)特征取得最差的识别精度(26%)。在前期和后期融合的评估中,总共选取了5种具有代表性的描述子。实验结果表明后期融合的效果要好于前期融合,同时也可以发现识别的精度并不随着融合特征个数的增加而提高。此外,本文还通过对2组不同的成像因素(“简单/复杂”,“夏季/冬季”)进行评估,实验结果表明成像因素对识别精度具有十分明显的影响。针对人工设计特征的低效和红外视频纹理特征不明显的问题,本文为红外视频改进了一种基于双通道卷积神经网络的行为识别方法。该方法通过结合外形通道学习到的外形信息和运动通道学习到的运动信息,得到一种较为全面的行为表达。然后再把该特征表达输入到支持向量机(Support Vector Machine,SVM)分类器中进行学习测试。实验结果表明,该方法能够有效地识别红外视频中的人类行为,且具有较强的鲁棒性。
其他文献
【裁判要旨】申请人向内地法院申请承认与执行澳门法院判决时,内地法院应当依据《内地与澳门特别行政区关于相互认可和执行民商事判决的安排》的规定,仅对该澳门法院判决作形
【目标】N-乙酰-β-D-氨基葡萄糖糖苷酶(NAGase)是一种重要的几丁质分解酶,能从N-乙酰葡萄糖苷的非还原端催化去除β-1,4-N-乙酰-D-氨基葡萄糖残基,参与了昆虫外骨骼的蜕皮过
在中国广告业迅速发展的背景下,很有必要对河北省广告业进行梳理。从河北省广告媒体、广告经营单位现状、河北广告业目前存在的问题进行总结和观照,以期找出有效对策,对省内广告
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
大学生转专业政策是人才培养模式变革的需要,其有利于人才培养质量的提升,是高校遵循人才成长规律,培养学生个性发展的一个有效的举措。清华大学计算机系近年来逐步加强转系
为了增进对Al2O3抗热震陶瓷发展动态的了解,为Al2O3抗热震陶瓷的制备提供设计依据,针对Al2O3抗热震陶瓷的常用抗热震性测试方法,Al2O3陶瓷微观结构、表面条件、尺寸对抗热震
干部队伍建设是高校图书馆事业发展的核心问题。从内蒙古农业大学图书馆队伍现状出发,分析存在的问题和不足。并根据当今时代发展要求,对高校图书馆队伍建设提出几点建议。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield