三维音频中主声源—环境声提取算法的研究

来源 :武汉大学 | 被引量 : 1次 | 上传用户:alex_juve
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着3D游戏和家庭影院等数字多媒体的发展,消费者要求更加身临其境的聆听体验。沉浸式听音体验是使用回放设备对录制的音频内容进行空间音频再现的目标。为了实现高效的空间音频再现,受人类听觉系统的启发,声场被认为是前景声音(Primary,主声源)和背景声音(Ambient,环境声成分)的线性组合。由于人耳对主声源和环境声成分存在感知差异,通过对主声源和环境声成分分别使用不同的渲染方案,可以保留各个成分独有的空间特性,并实现沉浸式的空间音频再现效果。由于现有的基于声道的音频信号都是不同音频成分的线性组合,这就需要从混合信号中提取主声源和环境声,这个过程被称为主声源-环境声提取(Primary-Ambient Extraction,PAE)。准确的PAE算法,可以很好的提高再现空间音频的质量。本文着重研究多声道和多主声源的PAE算法,以期通过更准确的PAE算法来实现高效的空间音频再现。现有的PAE算法多是针对立体声信号的,而针对多声道信号的PAE算法不够完善。现有多声道PAE算法计算复杂度较高,以及空间性能较差等问题。为了得到更准确的多声道PAE算法,本文分析了现有的多声道PAE算法,并提出了基于最小二乘法的多声道PAE算法,解决了现有算法计算复杂度较高和空间性能较差的问题,使多声道PAE算法具有更优的提取性能。通过实验证明,本文提出的算法在空间精确性和计算复杂度上都明显优于现有的多声道PAE算法。通过研究现有的PAE算法,发现目前PAE算法的主要处理对象还是单一主声源的混合音频,而对于多主声源混合音频的研究,很少涉及。本文针对多主声源PAE算法的研究现状,介绍了传统基于PCA的多主声源PAE算法,并在传统方法的基础上引入一个量化主声源和环境声能量的参数,设置阈值对主声源的提取进行控制。实验证明,本文提出的方法在主声源的提取性能上明显优于传统算法,解决了传统PCA算法误差较高的问题,平均降低了 5dB的误差信号比。本文对多声道以及多主声源PAE算法进行了深入的研究和讨论,并在传统方法基础上做出了改进。其最主要的目的还是得到更准确的PAE算法,以通过更准确的PAE提取来实现沉浸式的空间音频再现听音体验。
其他文献
本文以破产企业的涉税政策为研究对象,分别从破产程序中的税收和滞纳金债权及其优先性、破产重整企业的税收优惠的有关政策、税务机关是否适合主动向人民法院提起申请企业破
[设计理念]情绪分为正性情绪和负性情绪,正性情绪发生时自然皆大欢喜,但负性情绪的发生是不可避免的。由于青春期内心闭锁,不少学生在感觉到自己的负性情绪时,往往会优先选择
投资者-国家争端解决机制渊源于国际商事仲裁,其目的在于避免此类争端解决的政治化。投资者-国家争端解决机制在发展中逐渐显现出若干缺陷,国际社会为此进行了大量探讨并提出
佛教自汉魏传入中国之后与我国两千多年的文化不断碰撞融合,隋唐之时才得以形成独具中国特色的佛教文化。在这个过程中不乏一代又一代的中国学佛者做出的努力和贡献,正是他们
鲁迅小说是现代文学的一座丰碑,在初中语文阅读教学中占有一席之地。然而,当前鲁迅小说阅读教学似乎不尽如人意,存在教学效率相对较低、学生怕学、教师怕教以及教学中的“新
2017年全国统一使用部编本初中语文教材,教材中新增“小人物”单元,并且在单元导语中写道“本单元的课文都是关于‘小人物’的故事。这些人物虽然平凡,且有弱点,但在他们身上
流型是气液两相流研究的基础。相对于直管,螺旋管内气液两相流流型研究仍不够充分。在离心力的作用下,螺旋管内的两相流动变得更为复杂,流型及其转换规律也具有特殊性。本文
近年来,随着我国钢铁产能的不断增加,高炉渣作为高炉炼铁的主要副产物产量也不断增加。目前,我国高炉渣主要是以传统粗放式利用为主,降低了其经济价值。为了高炉渣高附加值利
仪式是人们在特定场合举行的、由仪式主体、仪式进程和仪式客体等系列基本要素组成的具有象征、表演和整体等内在特性,并含蕴共同价值信念与追求的社会性文化活动。随着社会
将超媒体技术和客户/服务器模型相结合,建立了“基于客户/服务器环境的多媒体创作平台HCS”。本文介绍了HCS系统的设计思想、总体结构及系统的组成和特点。