论文部分内容阅读
随着互联网和数字多媒体技术的迅速发展,人们可以通过互联网等各种渠道方便快捷地获得、编辑、复制和传播越来越多的数字音频。这给人们带来了很大便利,但同时也产生了日益严重的安全问题,诸如数字音频的版权保护等。作为数字音频版权保护的一种重要手段,数字音频水印技术具有非常重要的应用前景,近年来已经取得了快速进展。然而,仍然存在着许多有待解决的关键问题。本文在深入分析鲁棒音频水印方法的基础上,对基于机器学习的水印方法进行了深入的研究,探讨了三种新颖的基于机器学习的音频水印技术。论文的主要内容如下:(1)针对现有的一些基于机器学习方法(诸如神经网络、支持向量机等)的训练算法复杂和训练时间长等问题,提出了一种基于核判别分析的音频水印方法。在降采样技术基础上,设计了一种能量关系调制技术。这种能量关系调制技术主要由两部分组成:一是能量关系的调制,二是DWT系数的比例调制方法。它带来的优点是能够较好地保障水印系统的不可感知性(即含水印音频的听觉质量),并且将能量关系隐藏到音频信号中。基于核判别分析的水印检测器通过学习在音频信号中所隐藏的能量关系以提取出水印。借助于核判别分析的强大的(非线性)学习能力和良好的泛化能力,这种水印检测器具有高的鲁棒性,同时核判别分析的训练算法具有简单、快速的优点。(2)以寻求不可感知性和同时抵抗常规信号处理操作和去同步攻击的鲁棒性之间的平衡作为优化目标,提出了一种多小波域中的能够抵抗常规信号处理操作和去同步攻击的音频水印方案。首先,采用均值量化技术在时域嵌入同步码,其作用是用于确定水印信号的嵌入位置以抵抗去同步攻击对水印嵌入位置的破坏。其次,设计了一种能量量化调制方法用于实现水印的嵌入。该调制技术以低频多小波系数的局部能量指标作为调制对象,并通过代数学公式导出相应的多小波低频系数的修改公式。最后,利用粒子群优化技术所设计的音频水印优化过程自动地确定水印算法的最优水印参数。所得到的最优水印参数能够使不可感知性和同时抵抗常规信号处理操作和去同步攻击的鲁棒性之间达到最优平衡。(3)最优音频水印问题本质上应该是一个多目标优化问题。然而,先前的基于遗传算法的水印方法或方案采用一种加权和形式将最优音频水印问题转化为一个单目标优化问题来求解。针对最优音频水印问题的多目标本质,提出了一种用于音频水印算法性能优化的多目标优化框架。以多目标遗传算法NSGA-II为基础,设计了一种具有变长机制的多目标遗传算法及其音频水印优化过程,其中变长机制包括变长染色体、初始化机制、混合交叉操作和变异操作。传统的音频水印算法容易被集成到这个框架中,并且利用这个音频水印优化过程能够为这些传统的水印算法自动地确定最优水印参数和搜索最合适的嵌入位置。此外,Pareto最优解集的多解特性能够为所设计水印系统提供更大的灵活性。