三维音频系统空间信息恢复研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:jay12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
3D电影给用户带来了逼真的视频刺激,虚拟现实意图为用户带来真实的感受,然而,音频定位与视觉上的位置感知不一致,无法为用户提供身临其境般的享受。MPEG启动的3D音频标准化工作,极大的刺激了 3D音频的研究与发展。三维音频回放系统可以为听音者带来水平、高度和距离三个维度的感知,以及三维空间音效的包围感和沉浸感,是虚拟现实和多媒体领域不可或缺的重要组成部分。近年来,众多国内外著名高校、研究机构和标准化组织均投入大量资源开展三维音频的科学研究、系统开发和标准化工作,三维音频技术已成为多媒体领域的研究热点。日本广播协会设计了 22.2多声道3D音频系统,是日本家庭环境中超高保真视频标准对应的3D音频伴音标准,ISO/MPEG标准化组织启动了 MPEG-H 3D Audio标准的制定,以22.2多声道系统为参考3D音频系统,同时建立了相应的编解码框架。尽管在产业届和学术届对3D音频均十分重视,但是3D音频的发展仍存在一些挑战。声源空间方位感知的三个要求:水平方向(方位角)、垂直方向(高度角)和距离,方位角和高度角的恢复比较准确,而距离恢复误差很大,22.2多声道3D音频系统中对距离信息无法做到良好的恢复,距离信息感知无失真恢复亟待解决;精确重建声场的计算复杂度高、对环境和扬声器配置要求严格,如22.2系统对扬声器数量和布置提出了明确要求,如各扬声器的高度、距离、与水平面的夹角等等都有规定,家庭环境难以满足。针对上述需求和挑战,本文研究3D音频系统距离信息恢复理论与技术、任意扬声器布置下的3D音频恢复技术,以及音频声场重建的高效计算方法,提升听音者对声源3D空间的感知,推进3D音频技术的普及。(1)基于粒子速度的幅度平移三维音频系统幅度平移技术在杜比、DTS公司的回放系统以及MPEG-H 3D Audio标准、日本超高清电视伴音标准得到了广泛应用,然而,经典的幅度平移技术要求扬声器位于同一球面上,听音者位于球面中心,实际应用难以满足。粒子速度的方向与声源的方向具有一致性,且粒子速度的大小会影响声音能量的大小,进而影响声源距离的感知。本文提出基于粒子速度的幅度平移技术,在声音重建系统中,建立听音点处多个扬声器叠加的粒子速度与声源在听音点处粒子速度之间的等价模型,求解此模型进而得到重建系统中扬声器信号的分配,实现声源方向信息和距离信息的感知恢复。(2)三维音频系统中距离信息恢复技术三维音频系统因扬声器数量较多,无法适应普通的家庭环境,多声道系统精简技术应运而生,然而,精简过程中能量出现明显误差导致距离信息恢复不精确。本文首先从理论上证明当前精简系统信号分配过程中接收点处接收到的声音能量不守恒,进而提出声源方向信息和距离信息同时恢复的三维音频重建模型,在扬声器选择、模型建立、模型求解等重建过程中的各个环节做出理论分析,证明了恢复三维音频所需的扬声器数量的边界,给出模型的解析解,以及不满足边界条件时的最优解。通过客观实验和主观实验验证了所提技术恢复3D音频的能力:均方误差小于对比算法,对单频音和复合音,所提算法对声源的距离恢复和空间感知均优于最新的研究成果。(3)基于逐步回归的三维音频信号恢复经典的三维音频重建理论如WFS、Ambisonics计算复杂性高,扬声器配置要求严格,需要一种高效的、灵活的声场恢复理论与技术以促进三维音频的普及。本文分析声场重建的过程和目标、分析机器学习理论与声场恢复理论之间的共性,进而提出逐步回归的音频信号恢复模型,建立理论上的声压数据库,在此库上进行训练得到模型后,基于模型进行声场重建,从MSE、RMSE、SSE、原始残差、皮尔森残差、标准化残差和T化残差等训练指标观测模型的精度。利用建立的模型恢复少量理想声压和大量理想声压,误差均接近零。所提算法对扬声器配置没有要求,影院、家庭、车内等需要做3D声场恢复的封闭空间,均可建立逐步回归模型训练声场重建模块进而进行3D声音恢复。
其他文献
伴随着我国产业结构深度调整,“传统产业”逐渐向“服务型产业”、“协同型产业”、“环境友好型产业”转型,经济总量保持飞速增长。随着经济社会快速发展、产业布局调整和转型升级的不断加深,我国作为能源消耗大国不得不面对能源与环境、能源需求过剩与资源供给不足之间的矛盾。长江经济带煤炭资源丰富,但是在产业布局调整和转型升级中潜在的能源消耗与环境污染问题仍不容小觑,长江经济带绿色低碳经济发展需向全要素能源效率转
社会党国际是主张民主社会主义的世界各国有关政党的一个国际性组织。它成立于1951年,并在以后的历史发展中经历了多次纲领和组织的变迁和调整,逐渐成为在国际上有较大影响的国际性政党联合组织。社会党国际的每次重大调整,既是国际形势发生重大变化的反映,反过来,它也对国际格局和国际形势产生较大的影响,尤其是对信奉民主社会主义思想的政党和团体来说尤其如此。苏东剧变是20世纪历史上重要的事件之一,也是世界社会主
生物化学(以下简称生化)在口腔医学专业中是一门非常重要的必修课程,可为后续口腔临床实践课程打下夯实的理论基础。我校口腔医学专业生物化学课程于大学二年级开设,理论学时有限,为70个学时。而生化涉及到很多理论、概念以及复杂的物质代谢过程,特别是分子生物学的内容比较难懂和抽象。如何在有限的学时上好生化,如何上好生物课程第一堂课,提高学生学习生化的兴趣,绪论课效果的好与坏直接影响到学生对以后课程内容的学习
原文出处为:Cheuk Yin Lee,"Dream and Emotions in the Tao’an Mengyi", International Communication of Chinese Culture, March 2016, Volume 3, Issue 1, pp. 43—55.作者李焯然,澳大利亚国立大学哲学博士,现任新加坡国立大学云茂潮中华文化研究中心主任,研究领域有明
期刊
城乡关系是我国国民经济和社会发展系统中最重要的一对关系。城乡关系是我国社会关系的核心,城乡关系解决不好,不利于社会的和谐稳定,影响我国的现代化建设。新中国成立以来,中国共产党以马克思主义理论为指导思想,根据不同时期的国情制定了针对性的发展战略,我国经济社会发展取得了举世瞩目的成就,同时也带来了城乡差距扩大、“三农”问题突出等诸多矛盾。2017年10月,党的十九大报告首次提出实施乡村振兴战略,指出:
渎职犯罪是“97刑法”第九章中单独设置的与职权职务密切关联的一种犯罪,检察机关通过20年的实践,有力的打击了这类犯罪活动,充分彰显了刑法的价值和权威。对保护国家公权力的正确运行,提高国家治理能力,促进社会全面进步起到了巨大的推动作用。但是,通过司法实践也暴露了围绕渎职犯罪存在的许多问题,这些问题既有立法方面的不足,也有司法方面的疑难,主要表现为渎职犯罪的概念不明晰、渎职犯罪主体界定模糊、渎职犯罪法
意识形态安全是国家安全的灵魂和重要组成部分,事关政治安全、经济安全、文化安全和社会安全。进入新时代,意识形态领域的斗争和交锋愈发激烈,我国意识形态安全既面临着西方意识形态加剧渗透的压力,也面临网络信息化、主体信仰能力缺失和多元思潮冲击的新风险。对此,我们必须要从机制体制上手,努力构建集风险研判机制、风险预警机制、风险阻断机制和风险评估机制于一体的动态防控机制,以维护主流意识形态安全。
中国共产党作为植根于人民,为人民谋利益的政党,高度重视自身与群众的关系。从某种意义上讲,中国革命建设改革的一切胜利都可以归功于党与群众的血肉联系。中国特色社会主义进入新时代,在这样的背景下,对新时代中国共产党密切党群关系进行研究,有利于把握党密切联系群众的客观规律,增强党在新时代进一步密切联系群众的积极性主动性有效性。本文在考察新时代中国共产党密切党群关系的理论源流、历史基础及现实背景的基础上,系
城镇化是现代化的必由之路。新中国成立以来,特别是改革开放40年来,我国城镇化发展迅速,约6亿农业转移人口进入城市,实现了人类历史上最大规模的人口迁移,为人类减贫事业和世界城镇化进程作出了历史性贡献,走出了一条具有中国特色的新型城镇化道路。城镇化和工业化共同推动中国从“站起来”、“富起来”并向“强起来”的伟大转变,加速了中国的现代化转型,改变了中国的面貌和历史发展进程。但我们也看到,在城镇化快速发展
近年来,随着全球人口的不断增加和环境的不断恶化,粮食安全成为了全球各个国家关心的重要安全问题之一。水稻作为我国重要的口粮作物,其生长过程中的长势监测和产量的准确估计一直是研究人员重点关注的问题。对于水稻全生育期的地上部分生物量的变化过程进行监测,有助于农技人员判断水稻长势,实时调整田间管理措施,确保水稻处于最佳生长状态,也能为农技人员精确估产提供可靠的数据参考。无人机遥感技术以实时、便捷、无损观测