基于卷积神经网络的室内场景动态光照估计

来源 :四川大学 | 被引量 : 0次 | 上传用户：hua1kai

【摘要】

：

【作者】

：

郭智溢

【机构】

：

四川大学

【出处】

：

四川大学

【发表日期】

：

2021年01期

【关键词】

：

室内场景动态光照 HDR 合成数据集卷积神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

增强现实技术将经过计算机渲染的虚拟物体与真实场景相融合,广泛应用于电影制作、医疗辅助、工业生产、娱乐等领域。为了保证虚拟物体和真实场景融合的真实感,需要渲染虚拟物体时使用的光照信息与真实环境保持一致,实现虚实融合的光照一致性。受可控光源的影响,室内场景中的光照条件比较复杂并且具有动态变化的特点。对室内场景光照的动态变化进行估计,是实现增强现实光照一致性的重要技术。综上,室内场景的动态光照估计具有重要的研究意义。早期的相关研究中,对室内光照的估计需要在初始化阶段输入有关场景几何特征或者光源的信息,例如使用人工手动标定场景内的光源或者通过专用深度信息扫描设备对场景进行三维重建来获取场景的几何信息。虽然这些方法能够得到比较准确的室内光照估计,但是一旦场景中的光照发生变化就需要重新执行这些繁琐的初始化步骤。近年来,随着深度学习技术的发展,研究者开始使用基于深度学习的方法来对室内场景的光照进行估计。这些新方法相比早期研究中的方法只需要更少的输入即能对场景中的光照进行估计。然而室内场景的光照是复杂多变的,这些方法因为使用的场景信息过少,造成光照估计结果往往只能保留低频部分,丢失了许多细节。若需要渲染的物体具有高反射率的光滑表面,那么渲染结果将会大打折扣。因此,结合传统方法和深度学习方法,使用合适的输入获得准确的光照估计结果,将具有重要的实用价值。为了使室内动态光照估计能够在可接受的输入条件下获得准确结果,本文提出了一种新的基于卷积神经网络的室内动态光照估计方法。该方法只需要一张包含场景内所有主要光源开启时采集到的HDR全景光照贴图作为初光照贴图,与光照发生变化后在场景中采集到的有限视界的LDR图像共同作为输入。通过对室内场景光照变化后对应的光照差值图像进行估计,并使用估计得到的差值图像更新初光照贴图来获取光照变化后当前场景的光照分布。本文的主要贡献如下:1.本文创新地提出了使用光照差值图像表示室内场景的光照变化。这种差值图像能够记录初始HDR全景光照贴图与场景光照变化后对应的全景光照贴图之间的差异。使用光照差值图像可从初始HDR全景光照贴图中恢复出光照变化后的光照贴图,从而能尽最大程度保留初始HDR全景光照贴图中非主要光源的细节,提升虚拟物体在真实场景中的渲染效果。2.本文提出一种基于卷积神经网络的双输入端对端网络估计光照差值图像。该网络能通过初始HDR全景光照贴图与光照发生变化后在场景内采集到的有限视界的LDR图像,对光照差值图像与光源掩膜进行估计。该网络包含三个子网络:LDR图像特征提取模块、光照差值图像估计模块以及光源掩膜估计模块。其中,两个估计模块以U-Net架构为基础使用了共享编码器的策略来提升网络性能。为了加强网络对光照差值图像中光源变化区域的关注,本文引入了Attention Gate注意力机制模块,进一步提升光照差值图像估计模块的准确性。3.本文制作了一个使用渲染引擎渲染的高质量室内场景的动态光照合成数据集用于网络训练。基于Scene Net数据集提供的三维场景,重新编辑了数据集中的光源和相机位置,生成了一个包含多光照条件的HDR全景光照贴图数据集。同时为了进一步对网络进行测试,本文还制作了一个完全在真实场景中采集的包含多种光照情况的HDR全景光照贴图数据集。本文在制作的合成数据集和真实数据集上对所提方法进行了测试。实验表明:相比已有的方法,本方法能够较好的对室内动态光照进行估计且保留了更多的光照细节,使用本文方法的估计结果对虚拟物体进行渲染能够获得较为真实的渲染结果。

其他文献

基于神经网络的飞行冲突识别与调配方法研究

飞行冲突识别与调配活动在实际管制过程的占比较大,对该活动事项展开研究并研发出相应的辅助决策系统可以减轻人员的工作负荷和增强空管的服务能力。本文提出了基于神经网络的冲突识别与调配模型,通过学习历史数据获得管制员的管制策略,然后提供可被信赖的飞行识别与调配功能并完成相应系统模块程序的编写。探究相关的理论知识,该技术理论的研究往往结合航空器的运动学建立相应的数学模型,冲突识别尚可获得相对良好的效果但给出

学位

空中交通管制神经网络飞行冲突识别飞行冲突调配

基于卷积神经网络的低剂量CT去噪后处理算法研究

CT技术因其成像清晰、扫描速度快等特点在临床筛查、病情追踪医学领域得到了广泛应用。CT技术的出现为医生诊断病情提供了有效的参考,但近来有研究表明CT拍摄时产生的辐射会对病人的身体健康带来很大的隐患。因此人们也越来越重视CT技术中的X光带来的危害。研究人员尝试降低辐射剂量来减少对病人身体的危害,但实验结果表明,降低辐射剂量将直接影响图像质量的好坏,因为会导致获取的图像产生噪声和伪影,不利于医生对疾病

学位

图像去噪低剂量CT非对齐数据卷积神经网络无监督学习

基于轻量级卷积神经网络的骨龄预测设计与实现

十三届全国人大四次会议报告显示,2020年检查机关起诉涉嫌犯罪的未成年人的人数高达3.3万人,恶性案件低龄化的犯罪趋势使得国内对于未成年人骨龄鉴定需求有所增多。在国内的司法领域中,骨龄鉴定作为证据在对嫌疑人判刑方面发挥了巨大的作用。目前国内的骨龄鉴定主要依靠人工鉴定,依赖骨龄计分法对手骨发育进行等级评分得到预测骨龄,其缺点是需提前掌握相关知识并需要进行繁琐的操作,对于非专业人员来说是比较高的门槛,

学位

骨龄鉴定RSNA手骨公开集轻量级神经网络HYOLOv3框架预测网络Mul-lightNet

基于轨迹聚类和LSTM的航迹预测方法研究

近年来,民用航空产业进入到了一个高速发展期,未来的空中交通将越来越密集,空中交通管理正成为一个日益重要和复杂的研究领域。4D航迹预测是航空运输系统的核心要素,旨在提高空中交通的运行能力和可预测性,精确的航迹预测可以有效解决空域资源紧张的问题,并在冲突探测与解脱、协同管制等领域具有重要意义。随着数据挖掘与人工智能技术的飞速发展,越来越多的历史航迹数据可用于空域态势分析和监控,将其有效运用于智能空管系

学位

空中交通管理航迹预测数据挖掘轨迹聚类LSTM神经网络

基于未来帧的时间性反走样算法研究与实现

时间性反走样算法具有效率优势,是近年来被广泛应用的实时反走样算法之一。该算法通过将采样点平摊至历史多帧及复用历史数据的方式来实现实时反走样。在时域信息采样充分且历史数据可复用的前提下,该算法能取得和超采样反走样算法类似的效果。然而在实际应用中,上述条件并不一定完全成立。在历史数据不能被复用的情况下,将产生几何走样及重影等问题。除此之外,为了降低显存成本,该算法使用累积帧来代替历史多帧,这将导致误差

学位

时间性反走样未来帧几何反走样抗重影去模糊

基于深度强化学习的飞行器自主机动决策方法研究

随着现代战争不断向着信息化、智能化的方向发展,飞行器自主机动决策技术作为提升战斗机智能化水平的关键技术,也越来越受到世界各国的关注。现代空战环境复杂、态势瞬息万变,能够准确感知空战环境并生成合理决策的自主机动决策方法技术是近几年来军事技术研究的重点。近年来,随着人工智能技术研究的不断深入,深度强化学习方法在多种决策问题的解决上取得了一定的突破,为飞行器机动决策问题的解决提供了新的思路。本文以三维空

学位

深度强化学习飞行器引导决策空战决策

基于深度强化学习的终端区飞行冲突与调配

终端区是空中交通管制的重要部分,其任务是引导飞行器起飞、降落和有序进离场,随着空域内飞行器数量的增加,终端区空中流量增大,容易导致飞行冲突,引发空中交通阻塞和航班延误,影响飞行安全,因此研究终端区飞行冲突调配具有重要意义。终端区飞行冲突调配是根据当前飞行器参数,判断未来一段时间内飞行器之间的距离是否会小于安全间隔的规定而导致冲突,并对可能的潜在冲突采取措施避免发生碰撞的过程。本文在现有空中管制技术

学位

飞行冲突调配深度强化学习MADDPG算法

基于深度学习的低空监视雷达目标检测的研究

在低空监视领域中,小型飞行器的机载设备受制于功率和成本,很难准确播报本机的运动参数,只能通过雷达对其进行主动检测。这类小型飞行器具有的飞行高度低、飞行速度慢和雷达反射面积小等特点,极大增加了雷达目标检测的难度。日益增多的小型飞行器造成了许多空管事故,因此,提升雷达对低空空域小目标的检测能力,成为近年来空管领域需要迫切解决的问题。本文针对基于深度学习的雷达目标检测算法展开了深入研究,根据低空目标的特

学位

目标检测低空监视雷达雷达信号处理深度学习

人脸图像盲去运动模糊的深度学习方法研究

数字图像一直在信息的传递过程中扮演着重要的角色。如今多媒体信息爆炸的时代充斥了图像和视频等数字信息,同时也存在着包含大量模糊人脸图像的问题。无论是人们日常分享生活、传递信息还是在科研领域中如智能安防、目标或人脸检测或者自动驾驶等计算机视觉任务都需要依托大量清晰的图像,因此将模糊图像重新变得清晰是一个急切且广泛的需求。在图像处理领域中,将图像的模糊主要分为了高斯、散焦、运动、衍射等类型,其中由运动所

学位

深度学习图像盲去运动模糊生成式对抗网络人脸分阶化的损失函数

基于生成对抗网络的视网膜OCT图像去噪与超分辨率方法研究

光相干层析扫描技术（Optical Coherence Tomography,OCT）因具有非侵入性和微米级分辨率的优点而成为眼科疾病诊断的重要工具。然而,基于OCT技术的诊断存在两个无法避免的问题。首先,采集的OCT图像中存在大量斑点噪声;其次,在采集过程中,为了尽可能避免数据丢失,通常采用低空间采样率进行采样,但由此得到的OCT图像具有较低的分辨率。因此,当前临床上需要可行有效、并能同时实现O

学位

光相干层析成像图像去噪图像超分辨率生成对抗网络无监督学习

基于卷积神经网络的室内场景动态光照估计

与本文相关的学术论文