论文部分内容阅读
近年来,由于数字多媒体信息处理技术和计算机网络通信技术的快速发展,数字音频作品的制作、编辑、大规模复制、交换和传输变得非常容易,带来了严重的音频盗版问题,另外网络通信安全问题也日益凸显。数字音频水印技术利用数字音频信息的冗余和人耳听觉上的掩蔽效应,在保障数字音频信息质量的条件下,通过相应的隐藏算法将水印信息隐写在数字声音信息中,以保护数字音频信息的版权、证明产品的真实可靠性、跟踪盗版行为、提供产品的附加信息或者进行隐蔽通信。数字音频水印技术是信息隐藏技术研究领域的一个重要分支,是实现版权保护的有效方法。音频水印是隐藏在强背景(数字音频)上的一种特殊的弱信号,水印的提取可以使用检测设备或水印提取器进行。大多数情况下,要求音频水印是在听觉上不可察觉的,也就是说水印的嵌入应该不影响载体音频的听觉效果。而不可察觉性(透明性)是建立在人类听觉感观特征之上的,由于人类的听觉器官比视觉器官要更敏感,所以音频水印算法研究比图像水印算法研究更加困难。音频水印算法必须满足一些必要条件,其中,三个最基本的要素是鲁棒性、不可觉察性和嵌入容量,这三者之间相互矛盾。通常情况下,算法的鲁棒性提升会伴随着透明性和容量的下降;另外,嵌入容量提高也会带来透明性下降;而要提升透明性则常常要牺牲算法的鲁棒性能或嵌入容量。自1993年数字水印的概念被提出以来,鲁棒音频水印的研究备受学者们的关注,相关的研究成果也不断被出版,但是鲁棒音频水印的性能依然存在许多不足。为了实现音频版权保护和满足音频隐蔽通信的需求,本文首先对鲁棒音频水印技术进行综述,并具体从常规鲁棒音频水印技术、抗DA/AD变换鲁棒音频水印算法和大容量音频水印技术三个方面进行综述并得出结论:传统的音频水印技术由于基于音频信号的一维线性特征嵌入水印,导致大多在鲁棒性能方面存在不足,常常只能抵抗加噪、滤波等简单的信号处理攻击,缺乏对主流测评工具(如Stirmark)的测试分析,且现有算法中,抗DA/AD变换攻击的性能较差,无法满足公共信息传播领域知识产权保护的应用需求。在鲁棒音频水印领域,针对大容量音频水印(或隐写)算法的研究相对较少,已有的算法常在牺牲鲁棒性或透明度的情况下提升算法的容量。研究针对不同的应用如何提高音频水印技术的鲁棒性能和容量是非常有意义的工作。本文通过分析针对水印算法的各种攻击,包括各种信号处理攻击、主流工具攻击、MPEG压缩攻击和DA/AD变换攻击等,重点分析这些攻击算法对音频信号时频特性的改变;研究时域和变换域上经典水印算法的鲁棒性能,分析不同嵌入域的自身特性以及对水印算法性能的影响;针对不同的应用需求,研究选择合适的嵌入域,平衡感知透明性、鲁棒性和嵌入容量三者要求,综合考虑各种攻击特性,设计嵌入算法和提取算法。提出了常规应用下具有强鲁棒性能的音频水印算法、抗DA/AD变换的鲁棒音频水印算法和大容量鲁棒音频水印(隐写)算法。对数字音频的版权保护和隐蔽通信应用具有重大意义。具体来说,本文的研究成果如下:(1)基于PPG变换的鲁棒音频水印技术对于常规的音频版权保护,传统的鲁棒音频水印算法直接针对一维的线性音频信号设计,参考算法[89]创造性地提出了一种基于二维空间的时域量化盲水印方案,但是该方案假定音频样本服从高斯分布,该条件在实际情况中不一定能满足。基于这一问题,本文通过对音频信号离散小波变换的子带系数进行合适的形态学变换(PPG变换)后,分析其分布特性,然后基于统计矩设计嵌入算法和提取算法,最后根据仿真实验优化调整算法各项参数。由于三维形态变换利用了音频信号的短时相关性,将水印引入的噪声分布到更宽广的人耳不敏感的区域,所以本算法在同等情况下,比传统算法透明性更好,鲁棒性能更佳,水印正确提取率更高。仿真实验结果显示,本文所提算法能有效抵抗常见信号处理攻击,如滤波、加噪、重量化、MPEG压缩以及主流测评工具Stirmark for Audio,水印算法的提取率在90%以上;同时水印音频的客观听觉质量达30dB以上。(2)基于Chirp信号和Radon变换的抗DA/AD变换鲁棒音频水印算法为了设计能应用于流媒体、音乐会和电视广播等应用领域的鲁棒音频水印,通过对该应用中存在的DA/AD变换过程的分析,得出DA/AD变换会导致音频信号出现波形失真和相位失真的结论。基于对Chirp信号和Radon变换特性的分析,提出了鲁棒音频水印算法,该算法能抗DA/AD变换攻击。算法选取小波域作为嵌入域,计算相邻帧信号Radon变换的统计矩,用矩大小关系来表征嵌入比特,同时引入具有特定频率特性的Chirp信号以提高水印算法抗DA/AD变换的鲁棒性能。由于Chirp信号具有的强穿透能力、良好的自相关性和抗噪声性能等特点以及Radon变换针对平移、缩放和旋转具有几何不变特性,所以本算法能够具有良好的抗DA/AD变换性能。实验显示,在基于电缆传输方式的DA/AD变换仿真环境中,在不同播放器和录音软件(如Windows Media Player、暴风影音、Cool Eidt等)条件下,水印算法的提取率在90%上。在同等情况下,本算法在抗DA/AD变化方面比传统算法具有更高的鲁棒性。(3)基于音源分离的大容量音频隐写算法针对隐蔽通信和大容量水印应用的需求,为了提高隐写或水印容量,通过研究现有的源分离技术,提出了一种基于音源分离的新型大容量音频隐写技术。载体音频信号使用音源分离算法分离成多个近似源信号,然后在多个近似音源中进行信息隐写;接着将嵌入隐藏信息后的多个音源通过合成算法得到携带秘密信息的载体音频。测试结果显示,与经典的隐藏技术相比较,本文算法如果选择N个分离得到的音源采用经典算法进行水印嵌入,则能得到的水印容量是经典算法的N倍。综上所述,本文对鲁棒音频水印技术在不同应用环境下的鲁棒性能和嵌入容量展开研究,克服了传统鲁棒音频水印技术的鲁棒性能不强、嵌入容量有限的问题,提出了可应用于不同环境下的鲁棒音频水印技术,具有较为重要的理论意义和应用价值。在此基础上,本文最后总结了相关研究成果的创新之处,并期望结合已有的研究成果在抗安全性攻击方面进行进一步的研究。