论文部分内容阅读
网络语音通信随着即时通讯软件的快速发展而迅速普及,这吸引了广大学者开始研究使用网络语音流作为隐写的载体。基于网络语音流的隐写可以保证信息隐秘而安全地传输,从而导致其被不法分子利用会给网络和公众带来危害。为了应对这种挑战,其对抗措施——隐写分析也受到了极大的关注。但是从目前的研究来看,现有隐写分析方法还存在不同程度上的检测效率问题,诸如检测精度(特别是在低嵌入率时)不佳、隐写分析特征维度过高等问题,从而难以迅速给出准确的检测结果。鉴于此,本文从特征角度、分类器角度以及深度学习角度针对若干网络语音流典型隐写方法进行快速高效检测,具体研究工作如下:(1)基于网络语音流静音帧的隐写可以在拥有较高隐写带宽的同时保持良好的语音质量,目前缺乏有效的检测手段。在深入研究隐写操作对于网络语音流影响的基础之上,我们先后提出了两种低特征维度的检测方案。第一种检测方案使用静音帧不同编码参数的扑克检测结果作为隐写分析特征;第二种使用过零数和梅尔频率倒谱系数这两种常用于描述语音基频特性的相关统计量作为隐写分析特征。两种特征均以支持向量机作为分类器,对静音帧上的隐写行为进行检测。实验结果表明,两种方法都可以对静音帧上的隐写行为进行有效的检测。基于基频统计特性的检测方案虽然特征维度略高于扑克检测的方案,但可以提供更好的检测性能。此外,基于基频统计特性的检测方法可以在较少静音帧数目的情况下实现有效检测。(2)针对自适应多速率语音流固定码本域上现有隐写分析方法特征维度较高的问题,我们发现了固定码本脉冲相关性被隐写操作所修改,并据此提出了基于脉冲相关性的隐写检测特征,其维度仅100维,是现有检测特征维度的1/5,结合支持向量机,其检测结果已经优于现有的检测方案。为了进一步提升固定码本域上隐写的检测性能,我们设计了一种新型的多分类器组合模型。针对固定码本域上的隐写行为,使用现有的各种特征对所提出的多分类器组合模型进行性能评估和分析。实验结果表明,我们所提出的模型较之传统的支持向量机模型更为高效,其中基于该模型的最佳方案在10s语音流长度30%嵌入率时就已经可以达到超过90%的正确率,比现有方案高大约10%。(3)基于速率调制的隐写不对网络语音流的相关协议或者载荷进行任何的修改,这使得传统的隐写分析方法难以对其进行检测。而现有基于速率跳变间隔的检测方法存在特征不够完备且特征维度与语音样本长度成正相关的缺点。为了弥补现有隐写方案的不足,我们提出了基于深度学习的端到端隐写分析方案。该方案使用循环神经网络学习全局的速率相关性,使用一维卷积神经网络学习局部的速率相关性,然后将两种学习到的速率相关性融合送入全连接层后得到最终的检测结果。实验结果表明,我们所提出的检测方案可以有效地对使用编码速率作为载体的隐写进行检测,在语音流长度只有10s的低嵌入率情况下正确率比现有检测方案最高可多出10%。