论文部分内容阅读
在社会信息化发展迅速的今天,网络在我们生活、工作中已经普遍存在,很大程度上是必不可少的。网络带给我们更快捷、更丰富的资源和信息。但是于此同时,网络的安全问题也逐渐成为我们生活中需要面临的重要问题。由于现在的网络速度和硬件设备更新的逐渐加快,各种恶意的网络攻击活动也不断出现,例如,使用特定软件自动地大量地注册用户,损耗服务器的资源;或者使用软件进行自动网上投票,破坏公平竞争;大量地自动发送垃圾邮件,破坏网络环境;穷举破解用户的账号和密码,给用户的私人信息安全带来严重问题。这些问题严重破坏了网络环境,验证码技术的使用在很大程度上解决了这样的安全问题。同时在现实生活中,很多方面用到验证码识别技术。例如,文件的自动录入、交通监控中的车牌自动识别、对文字图像的数字化和字符化处理等等。它是模式识别领域中的一个分支,是此领域中的一个传统课题。在模式识别方面的专家学者在这方面已经做出了很多艰苦努力,但是没有一种通用的方法能够识别所有的验证码。目前,在国内和国际上还有很多学者在研究相关的课题。验证码识别是一个复杂的问题,它包括了模式识别中的多方面知识,而每一个环节和步骤中使用到的方法都可能影响到最终的识别结果。而且由于使用条件的差异,验证码识别也存在很大的适用性问题,所以对于验证码识别方面的研究还具有很大的研究价值和实践意义。验证码识别技术基本上分为三部分内容:数字图像预处理,数字图像中字符的分割,字符的识别匹配。在验证码图像预处理部分中包括彩色图像的灰度化、二值化和图像平滑(图像滤波)。也涉及到频域滤波和空域滤波、图像增强、图像降噪、图像压缩和图像融合等图像预处理技术。字符分割部分的方法比较多,而且字符分割的应用范围比较广。在车牌字符分割中的多项式拟合方法、特征统计方法、Canny边缘检测的验证码识别技术、微分算子法、Laplacian算子法和Canny算子法。还包括一些常用的特征选择算法:LDA(线性鉴别分析)方法、基于stroke滤波器的字符分割算法、基于SVM的字符分割和识别方法、基于半阈值的字符提取算法等等。文中主要介绍了自组织映射神经网络和改进学习规则的自组织神经网络,以及两种规则的比较。字符识别部分。包括基于KNN(K-Nearest Neighbor)算法的模板库匹配识别、遗传优化的BP网络识别、基于“日”字投影算法的字符识别、形状上下文验证码识别等。本文针对现实生活中网络验证码的普遍存在,介绍了网站验证码图像的生成过程和原理,分析了网络验证码对网络安全的作用。之后进行了验证码识别问题的研究,验证码的识别属于字符识别的范畴,是该领域中一个热点问题。本文主要对验证码的识别过程分为图像预处理、字符分割和字符识别等部分进行了详细介绍。本文识别的验证码图像中,包含的是简单的字符,而且本文介绍的算法也主要针对数字字符,而验证码生成技术越来越成熟,应用越来越广泛,更复杂更难以识别的验证码,甚至包含了汉字等。验证码的生成和识别技术还有很大的发展空间等待我们去研究开发。