论文部分内容阅读
验证码是用来区分计算机和人类的一种图灵机制,可以防止恶意破解密码、接收垃圾邮件以及用特定程序暴力破解方式进行不断的登陆尝试,现已成为许多网站的通行方式。目前应用最广泛的验证码是基于文本的验证码机制,这种机制的特点就是需要用户来解决文本识别问题以此来区别计算机程序。在本文中,我们对所有基于文本的验证码机制进行了系统的分析,并设计出了一种新颖的通用的破解文本验证码的方法。首先,通过滤波器将待识别字符的笔划块按方向提取出来,然后通过对这些笔划块按照位置进行组合,形成大块后用SVM(支持向量机)作为分类器进行识别,最后,采用一种图搜索算法,找出最佳的组合方式。采用此方法,我们成功破解了拉手网、优酷两个网站的验证码,成功率分别为48%,40%。这说明我们的方法是有效的,同时,我们也针对文本验证码提出了一些设计和改进的建议。