基于三维模型自约束学习的真实物体识别

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户：ferret

【摘要】

：

卷积神经网络在基于大量真实图像训练的基础上对于分类问题表现出优异的性能。从实用角度出发,使用从三维模型渲染的虚拟数据进行训练可以减少收集真实图像的工作量,尤其是利

【作者】

：

王一达

【出处】

：

北京邮电大学

【发表日期】

：

2017年01期

【关键词】

：

卷积神经网络自动编码机虚拟图像三元组损失变分自动编码机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

卷积神经网络在基于大量真实图像训练的基础上对于分类问题表现出优异的性能。从实用角度出发,使用从三维模型渲染的虚拟数据进行训练可以减少收集真实图像的工作量,尤其是利用一些简单模型更能提高效率。有效利用无纹理的三维模型进行深度学习对于真实照片的识别非常重要。本文通过四个方面改进卷积神经网络来消除它对大量真实训练数据的依赖:首先根据三维模型通过有效数据渲染手段批量渲染大量训练数据;然后基于两种在单一样本层面互相对应的不同的渲染数据用深度神经网络学习一个前景还原网络和多负样本三元组损失函数训练的分类网络;第三,基于以上两个步骤设计一个紧凑参数模型克服由无纹理模型渲染的数据导致的的过拟合问题;最后应用条件变分自动编码机理论重新构造步骤二中的前景重建网络进行附加深度信息的语义渲染来辅助分类网络训练。在学习结构的设计中,我们提出了由多负样本三元组损失函数和softmax损失函数组成的联合训练过程引导的级联自约束深度学习结构。用多三元组损失函数来初始化网络的训练,根据通过虚拟数据提取的相机机位信息在每个物件类别中建立高维球状分布的特征,这样就有助于根据物体姿态、照明条件、渲染图像的背景和类别信息来辅助识别常规照片。然后利用附加数据对网络参数进行再训练进一步满足在初始模型基础上对一些特殊真实照片的分类的目的。针对前景重建问题,我们从有背景和无背景的虚拟渲染数据训练前景还原网络,利用局部连接的自动编码机产生附加通道数据作为分类网络的输入自动连接到RGB通道。这种结构使直接从卷积神经网络基于合成数据用我们的渲染策略训练softmax分类器成为可能。我们的网络结构从识别正确率上减少了基于3D模型渲染的虚拟数据和真实照片的训练的差距并且性能逼近了在PASCAL和ImageNet数据库中用虚拟数据训练和真实图片测试时在特定评价方法下与GoogleNet直接通过真实照片训练分类器的结果。为了解决深度神经网络中常见的过拟合问题和参数膨胀问题本文设计一个基于SqueezeNet的6.2 MB大小的ZigzagNet紧凑卷积神经网络模型,以通过在网络微观结构内部应用可变batch normalization和通过宏观网络结构添加卷积旁路分支来提高识别性能和学习稳定性。可变batch normalization在收敛速度和识别精度上在这里表现出了良好的性能。在基于简单的最近邻分类器的PASCAL3D+提供的ImageNet和PASCAL样本的实验中的我们的紧凑参数模型的精度接近于用真实图像训练的240 MB的AlexNet模型得到的结果,同时在无纹理模型上训练的模型在渲染和收集上花费的时间远少于使用来自ShapeNet的更多纹理模型的训练结果。最后我们进一步利用三维模型中的语义信息进行前景RGB通道渲染,在条件变分自动编码器的基础上学习另一种三通道附加通道来级联到原RGB通道进行真实物体识别。这种结构也基于使用在我们的渲染策略下合成的虚拟数据使得直接从CNN训练softmax分类器更加有效。在最终的基于级联生成模型的网络结构下我们的自适应噪声级大地提升了训练级联网络的稳定性和平衡性并在PASCAL3D+数据库中的ImageNet子集上得到了迄今为止最高的基于虚拟数据训练的识别正确率50.5%。我们的流程结构不仅仅在高效训练上有重要的意义,而且为三维模型的渲染方案提出了一个反向的指导,前景重建这一直观的任务可以直接针对数据迁移问题进行分析。

其他文献

基于RBF神经网络的城市需水量预测研究

鉴于RBF神经网络强大的非线性逼近能力及能够避免陷入局部最优的特点，建立了基于RBF神经网络的城市需水量预测模型，为提高神经网络的收敛速度及精度，利用退火遗传算法对网络进行

期刊

RBF神经网络需水量模拟退火预测

时空情境变换与农民工身份认同

农民工进城不仅意味着时间上的断续，同时也发生着生活场域的继替，不同时空情境对农民工有着深刻的影响。基于农民工时空情境的变换，将“进城前-进城后”、“乡村-城市”之相应情

期刊

身份认同情境变换乡土记忆城市体验未来筹划

深井曝气工艺的运转和设计

本文概述了国内、外对深井曝气技术的开发情况,工艺原理,构造形式,充气性能,流体力学特性,需要动力计算和生化特性等,可供试验研究和设计参考。 This article outlines the

期刊

深井曝气上升管循环方式充氧能力下降管空隙率

“三九”悲剧的三大启示

赵新先是一面镜子,“三九”是一面镜子。唐太宗李世民说过,以铜为镜,可以正衣冠,以史为镜,可以明兴替,以人为镜,可以知得失。以企业家悲剧为镜、以企业悲剧为镜,可以正什么、

期刊

法人治理结构创业企业家三九集团

《促织》补注

《促织》补注高中语文课本第五册十八课为清蒲松龄《聊斋志异》中的《促织》。文中叙述了一些蟋蟀的名称、形态、食物等等，课本中有关蟋蟀的注释较简略，故撰此文，聊当续貂。文中

期刊

《促织》促织经高中语文

哈尔滨冰雪电影节品牌重塑SWOT分析

本文在以上背景下,采用SWOT分析法分析重塑哈尔滨冰雪电影节的优势和机遇,劣势和风险。

期刊

品牌哈尔滨冰雪电影节SWOT

贵州燃气集团服务营销策略研究

随着经济社会的发展,人们的生活水平显著提升,消费者对于企业产品和服务质量的要求也在不断提高。同时,随着燃气行业市场竞争的不断加剧,如何通过提升综合服务能力,提升消费者的满意度和忠诚度成为企业追求的重要目标,也是其生存和发展的重要基础。贵州燃气集团以“致力一流品质服务,共建卓越能源集团”为企业愿景,将提升服务水平作为企业未来发展的指引方针,力求在服务营销上取得突破。本文主要借助文献研究法和案例分析法

学位

贵州燃气集团服务营销SWOT分析营销策略

全域旅游视角下安徽省红色旅游品牌产业发展的SWOT分析

安徽省作为旅游资源大省,其红色旅游产业开发极具前景和教育示范意义。为增强文化自信,宣传红色文化以及助力推动安徽省区域经济发展,我们从全域旅游视角下探索了安徽省不同

期刊

全域旅游红色旅游产业SWOT分析

机械工业新标准介绍

JB/T 11774.1—2014规定了数控重型曲轴旋风车床的型式与参数，该标准适用于车床身上最大回转直径3500mm～4600mm，最大工件质量大于或等于10t小于250t的数控重型曲轴旋风车床。 JB

期刊

旋风车床机械工业

RH农场全面预算管理问题研究

全面预算管理如今已成为企业日常经营管理中不可缺少的一部分,也是管理企业的一种重要方法。国有农场作为一种特殊的企业类型,是农业发展的推动力量。国有农场要想在长期经营发展中创造更大的经济效益,就必须要学习科学合理的企业运营管理方式,而全面预算管理就是其中具有重要作用的一个环节。黑龙江省国有农场如今面临着企业制改革,削减社会管理职能,规范各项企业制度,农场内部管理也越来越受到重视,但是全面预算管理在应用

学位

全面预算管理预算管理模式预算考评平衡计分卡

基于三维模型自约束学习的真实物体识别

其他学术论文