论文部分内容阅读
基于生物特征的身份认证采用自动化技术测量人的生理特征和行为特征并完成对实体身份的认证,是信息社会身份认证的主要发展方向。随着基于生物特征的身份认证系统的推广与应用,生物特征的存储和传输安全问题日益凸显。生物特征模板保护技术将生物测量和信息安全相结合,为生物特征自身的安全性提供了一条可行的解决途径,逐渐成为国内外关注和研究的热点。考虑到声纹认证的优势及其应用趋势,声纹特征模板保护具有重要的理论和应用研究价值。本文从经典生物特征模板保护技术与声纹的有效融合、基于信息安全新技术实现声纹特征模板保护两大方面进行探索性研究。主要工作如下:(1)开发了声纹身份认证平台SVoiceprintAuthen,采用MFCC特征,实现VQ、GMM、GMM-UBM等识别算法,可进行基于文本无关的说话人确认、声纹特征模板保护等实验。(2)在特征空间,基于特征降维的思路解决正交变换泄漏原始特征信息的问题,定义通用的随机映射形式化表示并提出基于随机映射的声纹特征模板保护方法。在注册阶段,将注册声纹特征映射至随机空间后训练GMM模型,并存储模型参数作为模板;在认证阶段,待认证的声纹特征在相同的变换域与模型库进行匹配。理论分析特征降维对身份认证性能及模板安全性的影响,通过JL定理给出身份认证性能保持的降维下限,通过“l-安全”定理给出安全保护性能(满足无条件不可逆)的上界。实验结果验证了所提方法对声纹识别算法GMM、GMM-UBM和VQ的保护有效性以及特征降维的理论分析结论。在相同的降维条件下,VQ算法的身份认证性能较GMM算法下降更多(大于8%),说明所提方法更适用于GMM声纹认证系统的模板保护。(3)针对(2)中方法存在身份认证性能下降、无法保证变换的区分度、过于依赖密钥矩阵等问题,提出基于特征扰动和动态映射的声纹模板保护方法。在注册阶段,首先将注册声纹特征进行特征扰动,然后将训练得到的码字动态映射至不同的随机空间,随机矩阵的选择依赖于码字中每个元素的值;在认证阶段,待认证的声纹特征经过相同的特征扰动后分别映射至码字所在的随机空间进行矢量量化误差的计算。特征扰动可以增强模板间的区分度,提高可撤销性;动态映射增加了变换的不确定性,并加强特征模板和密钥之间的绑定关系以提高安全性。针对易遭受的典型攻击提出特征转换方法的安全性评估指标并详细分析特征模板的安全性。实验结果表明,对特征扰动后的码本和认证特征进行不同的随机映射时,ROC曲线近似为对角线,验证了方法的可撤销性。(4)针对随机映射缺乏可证明安全理论基础,结合模糊保险箱技术提出一种可撤销的声纹模板保护方法。注册阶段,首先将注册声纹特征映射至随机空间后训练码本,并在码本中加入杂凑点形成加密的声纹保险箱;认证阶段,待认证的声纹特征在相同的变换域与声纹保险箱进行匹配,计算矢量间的欧氏距离,然后利用标识码分离真实码字的最小失真测度并计算平均最小量化误差做出决策输出。详细分析了所提方法能够克服模糊保险箱的交叉匹配、杂凑点自由空间受限等缺点,提高声纹特征模板的可撤销性和安全性。采用二进制位计算代替互素比较分离真实码字的最小失真测度,提高了认证效率。最后通过实验验证该方法对VQ和GMM识别算法的有效性。(5)利用同态加密支持对密文进行运算的特性,在特征矢量构成元素层面,提出基于实数同态加密的声纹特征模板保护方法。注册阶段,采用实数域的同态加密算法对码本元素进行加密;认证阶段,认证声纹特征元素经加密后,在密文域计算认证特征与码本矢量间的欧氏距离分量差的绝对值,运算结果经解密后计算平均最小量化误差并决策输出。理论分析所提方法可以抵抗仅知密文攻击,但无法抵抗已知明文攻击。实验结果表明,加密后系统的身份认证性能可以得到保持。(6)针对(5)中方法存在密文泄漏了明文的大小关系、小数信息和正负数信息等问题,提出一种基于改进同态加密算法的声纹模板保护方法。首先构造一种改进的整数同态加密算法,明文加密后为正整数,理论分析该算法能抵抗已知明文攻击,且密文不会泄漏明文的小数信息、正负数信息以及大小关系。所提模板保护方法将实数形式的码本元素和认证声纹特征元素转化为整数,然后采用改进的整数同态加密算法对数据加密并计算密文的欧氏距离分量差,运算结果经解密后计算平均最小量化误差进行决策输出。由于认证过程在密文域进行,从而提高了特征模板的安全性。实验结果表明,整数转化引入的误差可能对VQ和GMM识别算法的身份认证性能造成一些影响,且GMM较VQ所受的影响更大。在对性能要求较高的场合,可以尽量取大b值,以保持身份认证性能。