基于全卷积神经网络的室内场景分割算法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:heyouzhang035
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉器官在人类获取信息时起到非常重要的作用,人工视觉假体通过向盲人体内植入电极,激发盲人剩余视觉神经功能并产生光幻视。视觉假体辅助盲人识别的物体边缘轮廓比较模糊、分辨率低,为了使盲人清楚地识别周围每一个熟悉的物品,在人工视觉系统获取外界图像之后,通过图像分割技术把物品大致的位置和轮廓显示出来,帮助盲人识别。针对室内应用场景的特点,本文提出一种快速卷积神经网络的图像分割方法对室内场景图像进行分割,构建了用于室内场景图像分割的FFCN(Fast Fully Convolutional Networks)网络,其采用Add技术的层间融合方法,优于Concat技术方法,可以减少网络计算参数量,避免连续卷积对图片特征信息的损失。为了验证网络的有效性,创建了室内环境中的基本生活物品数据集(以下简称XAUT数据集),在原图上通过灰度标记每个物品的类别,然后附加一张颜色表把灰度图片映射成伪彩色图作为语义标签。采用XAUT数据集在Caffe(Convolutional Architecture for Fast Feature Embedding)框架下对FFCN网络进行训练,得到适应于盲人视觉假体的室内场景分割模型。为了对比模型的有效性,对传统的FCN8s、FCN16s、FCN32s等模型进行结构微调,并采用XAUT数据集进行训练得到适应于室内场景分割的相应算法模型。实验结果中各类网络的像素识别精度都达到了85%以上,均交并比(MeanIU)均达到60%以上,其中FCN8s at-once网络的Mean IU最高,达到70.4%,但其分割速度仅为FFCN的1/5。在其他各类指标相差不大的前提下,FFCN快速分割卷积神经网络上平均分割速度达到40fps。本文提出的FFCN卷积神经网络可以有效利用多层卷积提取图片信息,避免亮度、颜色、纹理等底层信息的影响,通过尺度融合技术可以很好地避免图像特征信息在网络卷积和池化过程中的损失,相比于其他FCN网络具有更快的速度,有利于提高图像预处理的实时性。
其他文献
为了设计简单可靠的电机转速测量装置,提出基于PIC单片机为核心的船用主机与艉轴转速测量系统。整个系统包括转速信号的采集与调理,转速的计算,转速的模拟量输出显示以及外接
“中小企业贷款难、银行难贷款”问题已经成为中国很多区县经济发展的桎梏,亟需解决。究其形成原因则是多方面的,既有企业自身存在的问题,也有银行方面的因素,还有社会方面合
在股权分置改革完成后的全流通时代,我国上市公司控制权市场正全方位形成。本文选取全流通条件下沪深两市61家上市公司共63起大宗股权转让交易为研究样本,在以10%为控制权基
论述了科技的重要性和科技在脱贫攻坚中的作用,探讨了新时期科技助力脱贫攻坚工作的具体策略。
作者采用室内外结合的方法,根据台湾稻螟幼虫、蛹、卵的形态特征,制定了台湾稻螟分龄分级标准,并按所测定的相应虫态历期,采用分龄分级法进行了3年的发生期预测验证,平均准确
通过多重数理博弈的演绎推理,建立一个线性动态贷款竞争博弈模型,对商业银行贷款竞争的博弈过程进行分析。并针对纳什均衡点的稳定性以及各参数对该系统稳定性的影响进行数值
我国烈士褒扬条例和烈士纪念设施保护管理办法均明确规定,“在烈士纪念设施保护范围内不得从事与纪念烈士无关的活动”,“任何单位或者个人不得侵占烈士纪念设施保护范围内的土
报纸
农村劳动力流动带动了农村与城镇两部门间生产要素的重新配置。文章运用参数法度量阐释和分析农村劳动力流动的对要素配置所产生的效应,并对其在中国的实践情况进行评价。实
文章作者采用文献资料法、比较分析法,基于教学经验对影响初学者网球正手击球效果的几大因素进行分析,并提出相关建议。
膜法家用净水器顾久传周建芳(中国华晶电子集团公司动力工厂,无锡214061)(宜兴市侨联环保机械厂,宜兴214200)随着人口的增长和经济的发展,环境污染日趋严重,水源短缺,水质恶化,全世界每年有2.5万人由于