三维音频中空间线索感知特性研究

被引量 : 10次 | 上传用户:chenquanchenwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2009年3D电影《阿凡达》风靡全球,以其震撼的三维视觉特效、逼真的临场感震撼了观众,改变了人们的观影方式。随着3D电视、3D数字家庭影院逐步走进千家万户,也使得业界有了“影视进入3D时代”的断言。现有的三维视频技术已经能为观众提供较好的临场体验,但三维音频技术相对滞后,目前市面上销售的产品仅限于沿用原有的立体声或环绕声技术,这些技术已经不能满足消费者对三维音频听觉效果的需求。而要想达到身临其境的视听感受,必须要有与三维视频内容同步的三维声场听觉效果,目前国际知名机构和大公司都开展三维音频相关技术的研究,MPEG国际标准组织也开始制订三维音频技术标准,期望能将三维音频技术推广到普通家庭用户,这使得三维音频技术迎来了前所未有的发展机遇,并成为多媒体技术领域的研究热点和重要发展方向。为了获得更好的三维声效,需要布置大量扬声器,其数目甚至能达到数百个。声道数的激增使得三维音频的数据量增加为传统音频的数倍、甚至是数十倍,在受到实时转播带宽和存储媒介容量限制的情况下,会降低三维音频的重建效果。虽然可以通过参数化编码方法来降低编码码率,但参数的码率也会随声道数增长大幅增加,且空间参数存在大量的感知冗余,因此利用空间参数的感知特性去除参数的主观冗余可以最大限度的降低多声道的参数码率。另外三维音频的重建依赖房间和扬声器数量配置方式,使得各个系统不兼容,不能进行环境自适应调整,限制了三维音频技术的推广应用。而扬声器的布置要以最大限度降低人的感知失真为原则,通过研究人耳对空间方位的感知特性可以指导扬声器的排布,提高重建声像的听觉体验。综上所述,开展三维空间感知机理的研究,建立三维空间双耳线索和位置线索感知模型,将为三维音频的高效编码与重建提供理论支撑。本文在国家自然科学基金重点项目“移动音频编码的基础理论和关键技术”(No.60832002)和“三维音频编码的基础理论和关键技术”(No.61231015),教育部博士点基金“空间感知信息量度量理论与算法研究”(No.20090141110054)等项目的资助下,对空间线索的感知特性及其应用进行研究,从三维空间双耳线索的感知特性分析、三维空间位置线索的感知特性分析以及基于感知的三维音频参数化编码这三个方向上取得了创新性成果。在三维空间双耳线索感知特性方向,研究双耳线索恰可感知差异与双耳线索和频率的关系。空间音频编码方法将立体声下混为单声道,去除了声道间的客观冗余,但从立体声中提取表征方位的参数还存在着主观冗余,且随着声道数的增加参数码率的比例增大,对冗余的去除需求更为迫切,但目前仍没有有效的主观冗余去除方法。针对以上问题,本文探究了空间参数感知冗余存在机理,将音频信号感知特性研究从传统的能量域扩展到参数域,获取双耳线索的感知阈值与频率和双耳线索的关系,建立双耳线索感知模型。本文分别从音源信号频率和方位两个维度对双耳线索进行细粒度感知实验,使得建立的模型与人的感知机理更为吻合,对于参数的主观冗余去除具有重要的指导意义。在三维空间位置线索感知特性方向,将开展三维空间位置线索感知特性分析与建模研究。三维音频的声道数大幅增加使得数据压缩和声场重建等技术面临巨大挑战,利用方位感知特性指导参数量化和扬声器布置是解决以上问题的有效途径,现有研究主要在特定位置对方位感知特性做定性分析,无法实际指导三维音频的压缩和重建等。针对以上问题,本文将探究三维空间中位置线索感知机理,通过设计独特的实验装置采集三维空间不同位置的测试音源,建立测试音源数据库,设计自适应的心理学听力测试方法快速获得整个三维空间位置线索感知阈值,在此基础上建立三维空间位置线索感知敏感度的表示模型。通过曲面拟合可获得整个三维空间的位置线索感知阈值,进而利用数学方法表示方位感知敏感度的变化规律,为基于感知的三维编码与声场重建等研究提供了理论支撑。在基于感知的三维音频参数化编码方向,利用三维空间的双耳线索和位置线索的感知特性指导空间参数的量化和编码。现有三维音频信号的参数编码,在码率受到实时转播带宽和存储媒介容量限制的情况下,参数量化误差会导致三维音频的空间方位感失真,三维音频的空间声效质量会显著下降。针对以上问题,本文将三维空间的双耳线索和位置线索感知机理引入到参数的编码中,提出空间参数的感知无失真编码框架,只量化人耳可感知的参数变化量,去除参数的感知冗余。与现有三维音频编码方法(SLQP)相比,在质量相当的情况下,可降低约20%的参数编码码率,研究成果对于提高三维音频的压缩效率具有重要意义。本文在基础理论和关键技术方而的研究成果可望成为国内甚至国际三维音频标准的支撑技术,增强我国在高速成长的三维音频产业中的核心竞争力,为全面参与三维音频领域的国际竞争和标准化工作奠定坚实的研究基础。
其他文献
目的:探讨肿瘤MRI诊断符合度的影响因素,为提高MRI设备临床诊断效果提供依据。方法:采用多阶段分层抽样的方法,抽取2017年8月至2018年7月华中及华东地区16家医院6种型号(进口
清末实业救国思潮兴起之原因探析刘圣宜实业救国思潮,过去曾为学术界所贬责,认为它救不了国,阻碍了反清民主革命的兴起,是一服有利于维持清朝统治的麻醉剂。近年来,此说已有改变。
目前我国毒品社会问题的新趋势包括吸毒案件上升;贩毒方式零分包售,快递邮送;贩毒方式零分包售,快递邮送;网络渠道传播制毒吸毒信息,新型毒品案件增长较快,毒品案件重点区域
改革开放以来,家具行业在中国的发展可谓迅速。现已超过意大利成为第一家具出口贸易大国。福建省家具行业历经30余年不懈发展,已经形成了以大型企业为龙头、中小型企业为主体
本文从核电英语文本入手;研究在翻译过程中遇到的问题。核电文本有其自身的鲜明特征,这就要求译者了解核电英语的文体特点,了解核电英语的主题,并熟悉相应的翻译原则和技巧,并
目的探讨2型糖尿病患者周围神经病变(DPN)的危险因素及其与心率变异性的关系。方法对149名2型糖尿病患者行常规血生化、肌电图及心率变异性检测,分析2型糖尿病患者周围神经病
林白是九十年代专注于女性主义文学创作的作家之一。到了新世纪后,她的女性主义观念逐渐弱下来,从女性个体走向整个社会。论文以传统女性文化角色为切入点,分为三部分,第一部分从
在全球化的时代背景和中国走和平发展道路的政策指引下,中国地方部门在对外关系中的参与程度也达到了一个新的水平,成为当代中国政治、经济生活中的突出现象。而学科特点造成的
为提高牛粪厌氧发酵的甲烷产量,利用两相厌氧发酵技术研究牛粪酸化处理中的酸化时间、搅拌频率、料液浓度和氮素添加量等条件对产甲烷量的影响。在单因素试验基础上选取酸化时
《三遂平妖传》是中国小说史上第一部长篇神魔小说。它的故事原型来源于北宋仁宗庆历七年发生的王则起义,是以历史事实为基础,结合神话、传说以及前人的话本、笔记小说,整理编撰