论文部分内容阅读
随着信息社会的发展,信息技术逐渐融入人们的日常生活,但是恶意的网络攻击常常窃取用户的隐私对用户的安全构成威胁。为保障用户的网络安全,涌现出各种加密技术。加密算法的多样性和个性化则导致破解密码的难度极大增加。在密码分析和计算机安全中,大部分软件的破解效率通常较低,消耗时间较长导致计算资源的浪费。然而GPU和超级计算机的出现大大提高了计算机的计算能力,现代GPU可用于高度并行结构使其在处理大块数据时更高效,异构计算也逐渐运用到科研领域和实际项目中以提高计算效率。本文运用目前主流的机器学习模型:LSTM和TextCNN学习密码数据集的序列的依赖关系。使用自适应矩估计随机梯度下降方法,对数据集进行训练,解决了长距离依赖存在的梯度消失问题。从字典的生成效率和字典的覆盖率两方面分别设计了随机生成算法和全局生成算法生成密码字典进而辅助快速还原密码序列。本系统也可根据用户提供的自定义密码数据集生成个性化的字典,使字典变得更具有针对性。本文还基于异构计算平台设计了一个分布式密码分析平台,目前本密码分析平台可支持暴力破解和字典破解两种方式。将开源密码破解工具Hashcat改造后移植到长沙天河一号超算平台、广州天河二号超算平台以及本实验室自建的集群上。由于密码破解的耦合性低,在进行密码破解时可将任务并行化来提高计算效率。运用分布式计算技术,把待破解的密码任务划分成独立的子任务并由集群上各节点独立完成计算,由MPI消息通信机制进行节点之间的通信,提高了节点之间的协作效率。并将本密码分析平台和生成地智能字典结合,提高字典破解地效率。高效的密码破解技术可以帮助用户恢复被遗忘的密码。生成的高频密码字典还能够帮助用户避开此类密码以提高用户设置密码的安全性。从国家安全层面上来看,本系统的高效率能为安全部门快速获取有效信息以严厉打击危害民族团结和国家安全的行为。