基于Gabor滤波器的通用文本验证码破解方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:e1r2s3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
验证码现在被广泛应用于互联网上,其被用于抵制黑客的攻击以及恶意破解密码的自动化程序等。验证码的作用在于能够自动区分人类和计算机,从本质上讲验证码就是一种能够生成人类可以轻易通过而计算机却无法通过的测试。目前应用最广泛的验证码依然是文本验证码,所以针对基于文本验证码的破解仍旧是当前该领域最为广泛讨论的话题。截至目前已经提出了许多破解方法,这些先进的研究技术增加了验证码的鲁棒性,但是其中的大多数都有一定的局限性。本文提出了一种简单有效并且通用的方法用于破解大多数文本验证码。本文提出的破解方法只包含两大步骤,分别为提取笔画块和组合识别。首先,在提取笔画块的过程中主要使用Log-Gabor滤波器分别从四方向上对一张验证码图片进行滤波处理。其次,在组合识别的过程中需要先将提取出的笔画块按照最左上的像素进行排序,之后按照已经排序好的笔画块建立相应的图,并对图中冗余节点进行剪枝操作。在删除冗余后将剩余笔画块进行组合识别,在将笔画块识别为当个字符时主要使用到了K最近邻算法,对比了卷积神经网络,该算法在识别过程中性能最好。最后对识别出的字符进行图搜索,这里使用DP算法计算出置信度最大的识别结果,作为最终一张验证码图片的识别答案。在实验的过程中本文分别从图搜索算法、笔画块提取方向、滤波器、分类器以及与先前工作进行了对比,充分证实了文中方法的可行性和优越性。同时,为了强调方法的简单性,区别于传统的验证码破解工作,本文对所有验证码机制均不进行预处理操作。在提取笔画块的过程中本文首次提出将Log-Gabor滤波器用于破解验证码的工作,这是一次创新。而在组合识别的过程中本文最终选择了K最近邻算法,该算法并不需要使用样本集进行训练,能够节约大量的时间消耗,并且在识别过程中其性能最好。为了强调方法的有效性和通用性,本文将该方法运用到破解各种设计风格的文本验证码,包括空心验证码机制、字符分离验证码机制、以及字符粘连验证码机制等。为了获得不同风格的文本验证码,本文选择了破解Alexa排行榜最受欢迎的20个主流网站上部署的验证码,比如谷歌、雅虎、微软以及亚马逊等。对于所有不同种类的验证码机制,本文方法的破解率从5%到77%不等。本文不仅在破解成功率上获得了相对较高的结果,而且还在破解速度上也有所突破,文中破解一个文本验证码的速度均不超过15秒。除了上述验证码机制,为了更加深入的分析和验证文中提出方法的通用性,文中还选择破解了验证码研究领域内公认较难破解的验证码机制,包括较早版本的reCAPTCHA机制、Yandex验证码机制以及较难版本的Yahoo!验证码机制,均获得了一定的成功率。除此之外,通过分析文本验证码的安全性,本文为后续设计更加安全的验证码机制提出了宝贵的建议和意见。
其他文献
随着互联网技术不断发展,越来越多的设备被接入到网络中,IPv4协议在这样的趋势下暴露出了其地址数量不够用的问题。尽管多种技术被应用于延缓IPv4地址枯竭的问题,但仍无法改
当前,Web服务的规模不断增大,具有相同功能的Web服务也开始大量出现。当用户发起功能请求时,很难在众多同功能的Web服务中快速的挑选出服务质量较好的Web服务。与此同时,由于
光栅图像的矢量化表示是数字图像处理领域中的热点问题,在数字图像处理、编辑以及在动画制作等方面有着广泛的应用前景。随着网络和通信技术的发展以及手持终端的普及,越来越
随着信息技术和互联网的快速发展,各行各业都将网站和信息系统应用于生产经营活动过程中。现代信息技术为企业发展提供了强大的支撑。在高度依赖计算机和网络的今天,网站被篡
LTE-A(Long Term Evolution-Advanced,高级长期演进)系统已经成为了国际主流通信标准,为了国家安全起见,国家安全部门需要采用第三方仪表对一些用户进行合法的监听,因此有必
俄罗斯的众多作家对俄罗斯民间文化有着独特的情怀。如普希金、果戈理。这些独具特色的俄罗斯民间文化因素既增加了作品的内涵,也成为作家表达个人思想的一种方式。鲍里斯·
随着物联网技术的不断发展,无线传感器网络的应用前景非常广泛,人们对其应用场景和网络性能要求也愈发严苛。在某些特殊应用场景中,要求在保证网络高可靠性的同时,也能保证较
知识库引文推荐是指针对知识库内的实体,将与其相关的文档进行自动的筛选与推荐。随着知识库在各个领域的广泛应用,知识库引文推荐逐渐成为当前的研究热点,例如文本检索会议(
在认知无线网络中,实现主次用户频谱共享的前提是次用户(非授权用户)产生的干扰不能对主用户(授权用户)的正常通信产生影响。功率控制技术通过对用户的发射功率进行合理的分
当今的时代是信息爆炸的互联网时代,互联网已经深入普及到千家万户中,人们的交流方式呈现出了多元化和多样性,除了面对面、电话、短信等传统交流方式外,微信、qq、电子邮件等