论文部分内容阅读
近几年中,随着数据交换的迅速发展,数据安全问题变得越来越重要。数据一旦发生泄漏,将会对用户的隐私安全和财产安全产生极大威胁。版权认证和数据溯源已经成为数据安全防御机制的重要要求,各大安全厂商也将数据溯源作为重点研究内容,并取得了一定的成效。但是,在盗取数据所带来的巨大利益的诱惑之下,恶意人员的攻击方式与抗检测性也在随之发展,这无疑给数据溯源技术的研究带来了极大阻力。因此,研究有效的数据溯源算法便显得更加重要。本文通过对目前常见数据溯源技术的分析和研究,针对在数据类型复杂时嵌入溯源信息难、溯源准确率低的问题,提出了一种基于数据库水印的数据溯源技术。本文的主要工作和创新点如下:(1)对数据溯源系统的架构与定义进行分析;针对当前已有的数据溯源技术进行了整理;分别针对当前基于标记的数据溯源技术,基于区块链的数据溯源技术以及基于数据库水印技术的数据溯源技术进行了介绍,并对其中关键的基于数据库水印的数据溯源技术进行了详细分析;(2)通过对目前数据库水印技术进行分析和研究,针对目前现有数据库水印对数据类型的局限性,提出了一种基于虚拟元组的数据溯源算法。该算法利用数据字典和伪随机生成器分别生成虚拟元组中的非数值属性与数值属性,通过高仿真度的数据来实现水印信息的嵌入,并在数据泄露以后通过提取和对比虚拟元组追溯到泄露数据的用户,实验结果表明该算法在常见的数据库攻击下的溯源准确率较高;(3)通过对各种基于数据库水印的数据溯源技术的研究,针对目前数据溯源技术中存储空间大的问题,提出了一种基于参照关系保留的数据溯源算法。该算法可以突破一般数据溯源算法中对数据类型的局限性,且不需要额外空间来存储水印信息,通过使用不同的密钥对添加的主外键加密来实现不同用户的水印添加,进而实现水印信息的嵌入和检测;(4)依据上述两种数据溯源算法,搭建实验仿真环境,对这两种数据溯源算法分别进行测试。从实验结果可以看出,本文所提出的算法适用于各种数据类型的数据库,而且鲁棒性良好,为数据的分发和存储提供了更加有效的保障。