基于光场深度线索的场景深度和几何结构估计方法研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:iq106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
让计算机拥有像人眼一样感知三维空间的能力是计算机视觉的基础任务之一。人眼深度感知是多种深度线索共同作用的结果,而传统视觉算法以多视图像上的视差线索为主。由于从二维图像重建三维信息问题的病态性,视差深度线索存在像素匹配的鲁棒性不足和二义性等问题。近年来光场成像的广泛应用为深度估计算法带来新的变革,由于光场成像设备能同时获取光线的亮度和角度采样,其中蕴含的三维信息使光场在场景深度估计问题上具有深度线索提取和融合上的优势,因此基于光场数据的三维重建技术是光场理论研究的关键和计算机视觉未来的发展方向。本文从人眼视觉的深度线索感知和融合机理出发,围绕光场表示模型研究光场图像中的深度线索提取和线索融合,针对复杂场景的深度和几何结构估计问题研究了全局优化框架下基于场景先验模型的场景几何推断以及在此基础上的场景稠密深度获取和优化算法,取得以下创新性研究成果:(1)针对传统匹配方法深度线索的鲁棒性问题,提出了一种全局优化框架下的代价函数融合策略。提取传统视差线索以特征的匹配代价函数为评价标准,但单一的代价函数容易受到各种不利因素的影响,具有互补性质的代价函数融合能够增强全局优化的数据项的鲁棒性和局部可信度。并针对相机阵列光场提出像素匹配的可视性约束,解决多视条件下的场景稠密深度估计和局部平滑。算法在相机阵列平台拍摄的真实场景和Middleburry立体匹配数据集上的深度估计实验证明了该方法的有效性。(2)针对光场数据中的场景几何建模问题提出了一种基于EPI表示的平面场景检测方法。光场数据中隐式的包含了场景的几何结构信息,平面结构在EPI图像上体现为恒定的线性关系。算法采用EPI矫正和EPI上特征点提取的交叉验证策略,可以在不显式求出场景深度的前提下获得平面场景的几何参数。算法在光场数据中成功区分自然场景和其对应的照片,在EPFL光场数据集上的定量实验也达到了优于对比算法的检测正确率。利用平面结构检测还可实现光场在任意平面上的重聚焦和平面上的稠密深度估计。(3)为了获取场景平滑曲面的表面几何结构估计,在场景平面模型的假设基础上,提出了一种逐像素随机平面拟合的深度估计算法。算法采用全局优化框架,代价函数为提取光场表面相机表示模型上的深度线索,平滑函数为基于平面法向的二阶平滑先验,逐像素的以平面标签拟合场景深度和表面几何结构。算法在Middleburry立体匹配数据集和HCI光场数据集上进行了深度估计实验,结果验证了算法在场景深度和几何结构估计上的有效性,同时在HCI数据集上进行了深度估计精度的量化实验,结果明显优于对比算法。(4)提出光场深度线索在全局优化框架下的线索融合方法。针对遮挡和非朗伯体表面等复杂场景的深度估计问题,提出了在光场表面相机模型基础上的掩模匹配深度线索约束。为了提高场景局部深度线索的鲁棒性,构建了 EPI上深度线索的全局代价函数以及EPI深度线索与表面相机深度线索的融合代价函数模型。算法在HCI光场数据集和HCI 4D光场基准测试项目上进行深度估计实验并与当前最优的一些光场深度估计算法进行定量对比,在多项指标上都达到了当前最优。在斯坦福光场数据集上的实验结果也证明了算法在复杂场景下的有效性。
其他文献
智慧城市作为一种先进的城市发展理念受到了广泛的关注。智慧出行作为智慧城市的重要组成,不仅能够优化城市交通规划,还可以提高人们出行效率。智慧出行的兴起,改变了传统的
在复审过程中,不存在结合启示通常是复审直撤的一项重要考量因素,本文结合复审具体案例,探讨在创造性审查中结合启示的认定考量,并给出相应的解决措施,以此来明晰创造性审查,
以 2 4个山东省种植面积较大的小麦品种为材料 ,对 17个影响面条品质的主要小麦籽粒品质性状进行多元线性回归分析 ,在此基础上对 11个影响较大的品质性状进行通径分析 ,研究
孔子是有记载以来第一个把《诗经》作为教材用于私人学校的,《诗经》在孔子的心目中有着极为重要的地位,他认为通过学习《诗经》可以提升自己的道德修养,并借以考察社会、批评朝
在大连市长海县大长山岛海域选取A、B、C 3个区域,于2013年11月向A区和C区分别投放混凝土构件礁和新型贝壳鱼礁,B区作为空白对照区,于投礁1个月、半年和1年后对3个区域开展环
2003年3~5月,北京市部分居民小区发生了SARS的集中发病.发病期间北京市(区)疾病预防与控制中心对集中发病居民小区进行了流行病学调查和紧急处理,使居民区的集中发病情况得到
目的探讨应用组织运动二尖瓣环位移自动追踪(TMAD)技术评价冠心病患者左心室整体收缩功能的临床应用价值。资料与方法选择经冠状动脉造影证实的至少有1支冠状动脉狭窄程度≥70%
目的研究NS1619在哮喘小鼠气道重塑中的作用。方法BALB/c雌性小鼠24只,随机分为对照组、卵清蛋白OVA致敏/激发组(哮喘组)和NS1619干预组(干预组),每组8只。以卵清蛋白致敏,第19天予5%OV
模糊性是自然语言固有的特征,模糊也是模糊限制策略之一。在政府记者招待会这样的场合中,模糊限制语的使用并不鲜见。在这样的场合下,译员为沟通双方提供交替传译服务。政府记者招待会作为一种政治场域,模糊限制语的使用可能更为频繁。相对而言,以往的研究比较少采用基于语料库的方法描述和分析在此种场域下模糊限制语的使用。本研究试图基于自建小型语料库探讨政府记者招待会口译中的模糊限制语。本研究尝试回答以下问题:(1
本研究目的在于阐明糖尿病女性患者的体力活动能否降低心血管疾病的危险性。方法 研究对象包括美国护士健康研究计划选出的5125名护士,在1976年~1992年间接受过问卷调查,经医生诊断患有2型