论文部分内容阅读
随着科技的发展,虚拟听觉开始应用到生活与科研的方方面面。生活方面例如3D电影、3D游戏等。科研方面例如军事的模拟训练与视觉辅助系统的研究等。尤其是在视觉辅助系统中,虚拟听觉技术的应用有望使视障人群不再需要花费很多时间和精力通过训练来适应视觉辅助系统,而是可以通过虚拟3D声音信号直接感知障碍物的3D位置信息。头相关传输函数(Head Related TransferFunctions,HRTF)作为实现虚拟听觉的重要方法,也越来越多的受到研究人员的重视。 然而想要获取精确的虚拟听觉信号需要高分辨率的个性化HRTF,目前获取个性化HRTF的主要方法是实验测量,但实验测量获取HRTF对实验设备和实验环境以及实验个体的要求都非常的苛刻,因此获取高分辨率的个性化HRTF有一定的困难。如果可以通过研究获取HRTF的结构特性,那么就可以依据其结构特性对个性化的HRTF进行计算和更有效的插值。因此分析HRTF的结构特点和对HRTF进行准确的插值就显得尤为重要。 本文主要有以下三个方面的贡献: 1.利用流形学习算法对HRTF数据的低维结构进行了分析。首先选取了三种流形学习算法,并分析和验证了这三种算法的降维特点。然后利用利用这三种算法分别对HRTF数据中沿仰角方向数据和沿水平角方向数据的低维结构分别进行了分析,发现HRTF数据中沿仰角方向数据的低维结构为一维流形,沿水平角方向数据的低维结构没有明显特征,得出HRTF数据中沿仰角方向数据和沿水平角方向数据在低维结构上存在差异的结论。 2.根据HRTF数据低维结构的分析结果,提出沿仰角方向插值效果好于沿水平角方向插值的假设,并进行了实验验证。实验比较了线性插值中的仰角插值和水平角插值对HRTF数据的插值效果,实验结果证明了所提假设的合理性。 3.基于支持向量回归的HRTF插值。第一步,利用流形学习算法将HRTF数据降到低维;第二步,通过支持向量回归算法,建立低维与高维的映射模型;第三步,将低维数据拟合成曲线并插值;第四步,将低维插值数据映射到高维数据中,实现高维空间的插值。