论文部分内容阅读
在大数据时代,各行各业所产生的信息量和所需的传输带宽都在飞速增长。数字化处理时经典的奈奎斯特采样定理所规定的极限采样速率严重制约了人们对宽带数据的处理,它不仅给信息采集端带来压力,在后续的压缩编码等处理中也浪费了存储和计算资源。本世纪初压缩感知技术(Compressed Sensing,CS)应运而生,它边感知边压缩,以远低于奈氏采样率的特点而备受瞩目。本文将CS技术用于语音信号处理,针对实际应用时CS总压缩率仍不高的问题,提出了对语音的CS观测序列进行特征分析、建模压缩等二次操作以进一步压缩数据,降低数据传输时对带宽的要求。时间信号序列如语音序列的成功处理,得益于序列的成功建模,如语音编码领域的LPC和CELP模型、识别领域的HMM和GMM模型等。可以说,没有序列的成功建模,就不可能有现在广泛应用的语音信号处理技术。压缩感知作为一种可以替代奈氏抽样的对稀疏信号的采样技术,其广泛应用的前提也必须有对采样后的观测序列的成功建模。这是本文研究的背景和出发点。首先,本文详细研究了观测矩阵的选择对观测序列建模的影响。提出了观测矩阵选择的新原则:在选择观测矩阵时,不一定非得选首次压缩率最高(观测序列最少)的,而是应该放眼整个处理系统,选择一个让观测序列适于建模的观测矩阵,以便于后续对观测序列处理,让CS系统达到整体的最优压缩。本文用自相关函数来衡量不同观测矩阵下的观测序列是否规律、是否易于建模。在研究了多种观测矩阵对观测序列建模的影响后,本文选择了行阶梯矩阵。基于行阶梯矩阵,本文首先尝试将传统的语音模型包括LPC模型、正弦模型、曲线拟合等用于观测序列的建模,实验表明:由于投影观测破坏了原始语音信号的一些显著特征,这些十分有效的传统模型的建模效果都不理想。因此,需要我们研究新的观测序列建模技术。接着,本文研究了稀疏分解技术的相关理论,考虑到现在的序列模型规律隐含在压缩采样后的数据序列中,因此尝试使用基于冗余字典的分解来对观测序列进行建模。由于在仿真实验中,传统的正弦模型相比于其他模型的综合性能要好,受此启发,本文构造了一种由正弦原子构成的字典。稀疏分解算法有很多种,在分析了语音处理的应用场景后,本文选择了匹配追踪(MP)类算法,通过理论和实验对比了MP算法和正交匹配追踪OMP算法的分解性能并最终选择了OMP算法。实验显示,本文提出的基于OMP算法的正弦冗余字典模型能够有效地对语音的CS观测序列建模。论文的第三个部分研究的是建模的鲁棒性。考虑到实际采集到的语音不可能完全干净无噪声,通常情况下,这些背景噪声在观测矩阵的投影下可能被放大、扩散和变形,导致重构语音的性能大打折扣。因此,实用的观测序列建模技术必须考虑抗噪性。对压缩采样环节的研究表明,本文对比了高斯矩阵和行阶梯矩阵后,发现行阶梯矩阵有一定的信号消噪增强功能。但即使如此,常规的CS重构算法实验表明,基于行阶梯矩阵投影的重构语音的性能,相比无噪声情况也还是下降很多。因此必须在对观测序列的建模处理中考虑算法的抗噪性能。本文先分析了常见噪声的种类,并着重研究了基于OMP算法的正弦冗余字典建模方法对高斯随机白噪声的抵抗能力。仿真结果表明:在强噪声背景下,该建模方法能提高CS重构语音的性能。因此不管是出于压缩还是消噪的目的,本文的建模技术对于CS的实际应用均有裨益。