基于CNN的字符识别方法研究

被引量 : 53次 | 上传用户:chinesechinese123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工神经网络是基于对生物神经网络的模仿而提出一种模式识别方法,从提出到现在已有70多年的历史,期间人们对它的研究有过高潮和低谷,兴衰交替。2006年,深度学习的概念被提出,它模拟了视觉系统的层次化工作机制,提出构建具有层次化结构的深度神经网络模型,并取得了成功,使得神经网络再次成为人们的研究热点。而CNN (Convolutional Neural Networks,卷积神经网络)作为深度学习的一种实现模型,在1998年就得到了实现,如今发展的已比较成熟,特别是成功应用在手写字符的识别上。然而现在,对于复杂自然场景中字符的识别仍然是一个难题,主要是由于这样的字符具有复杂的背景、较低的分辨率、变化的光照强度,所以本文选择在研究CNN的基础上,与其他的方法结合,提出了新的识别方法,将之用于对自然场景中的字符识别,以期能够提高对自然场景中字符的识别率。本文在对CNN的基本理论进行研究的基础上并结合国内外对CNN的研究成果,主要做了如下的工作:(1)提出了结合PCA (Principal Component Analysis,主成分分析)和CNN的字符识别方法,即将PCA和CNN两者结合在一起,先对图像进行基于PCA的重建,然后再用CNN进行训练和识别。此外,我们使用了改进的CNN:一是采用多阶段特征(Multi-Stage feature)作为分类器的输入;二是在下采样阶段使用Lp-pooling,使用不同的p值进行试验,找到最佳的p值。(2)在SVHN数据集上进行了三部分实验:第一部分实验是验证在CNN中采用多阶段特征比单阶段特征能有效地提高识别率;第二部分实验是探索不同的p值对识别率的影响规律,并得到在对SVHN数据集进行识别时识别率最高所对应的p值;第三部分实验则是在前两部分实验的基础上验证基于PCA和CNN的字符识别方法的有效性,并与其他文章中的结果进行了对比。
其他文献
本文分析了新时期大学教师文化与学生文化产生冲突的主要原因,提出了要通过确立学生在学校的主体地位、加强师生间的相互沟通和理解、引导师生自我反省等措施,构建大学师生间
鲁敏是一位七十年代生人的作家,九十年代才开始进行文学创作,中间隔着文学花样不断翻新以求快马加鞭追赶世界的八十年代。她的创作没有经历过八十年代的爆炸似的不安稳,但是
随着金融行业全球化发展趋势的明显加剧,离岸金融的迅速发展已经成为国际金融行业不断繁荣不可或缺的一部分。在美国次贷危机造成的全球金融恐慌中暴露了全球经济一体化诸多
以我国裸燕麦为试验材料,总多酚得率为考察指标,通过单因素和正交试验,研究乙醇体积分数、料液比、盐酸含量、提取温度和提取时间对燕麦粉中多酚提取效果的影响。以水溶性维
摘要:随着我国经济的快速发展和人民生活水平的不断提高,人们的旅游消费观念和生活方式不断更新,“农家乐”作为一种新兴的旅游和休闲形式,在过去的几年时间里,得到迅猛发展,
我国小学中段识字教学的研究数量较少,理论水平较低,难以达到小学识字教学整体发展的要求。在新课程改革的影响下,小学中段识字教学的特殊性也更加明显。本研究立足当前小学
通过介绍市局区域自动气象站常见的保障模式现状,对保障模式进行分析,提出社会化保障需要解决的问题,以提高区域站自动气象站的保障水平。
目的:观察以益气养阴安神法为治则组方益气养阴安神方加减治疗2型糖尿病(T2DM)合并失眠症患者睡眠状况及血糖的变化,并探讨其安全性及有效性。方法:将60例来自门诊或病房的气
称谓语是语言的重要组成部分,不仅具有系统性,也具有民族性。称谓语可涉及说话者与受话者的性别、年龄、职业、地域、人种、民族,甚至还可以看出说话者与受话者的关系。交际
加入世界贸易组织10年以来,我国高度参与了国际分工与国际交换,并在事实上成为出口导向型大国。但由于我国对外贸易自身存在外贸依赖性上升、贸易结构不合理、贸易伙伴国过于