基于深度学习的手写彝文识别技术应用研究

来源 :中央民族大学 | 被引量 : 0次 | 上传用户:MM_8023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学字符识别是模式识别中的研究热点之一,其在邮件分拣、交通管理、银行票据识别等领域中有重要的应用前景。面向少数民族文字的光学字符识别研究有助于少数民族地区的基础设施建设,并能够促进其经济、文化、教育事业的发展,同时对净化网络环境也有一定的帮助,但除了维文、蒙文、藏文,其他少数民族文字的识别还没有被充分挖掘。据统计,彝文的使用人数达百万人之多,因此进行彝文识别的研究是十分必要的。本文使用深度学习的方法进行手写彝文识别研究,针对数据集缺乏的问题研究了聚类算法在数据集构造中的运用,建立了手写彝文数据集,并对深度学习网络的参数设置进行了探索,具体工作内容如下:(1)针对人工数据标注耗时耗力的问题,本文使用信息熵改进了一种基于密度的无监督聚类算法,并将其用于手写彝文数据集构造的类别标注过程中,结果表明,此算法不仅将人工数据标注的效率提升了两个数量级,并且在UCI聚类数据集的测试过程中,获得了优于原算法的效果。(2)在设计手写彝文识别卷积神经网络的过程中,本文对卷积神经网络的参数调整进行了探索,分别对比并分析了卷积层个数、卷积核个数、Batch-size、学习速率这四个参数对准确率的影响,给出了参数调整的一些经验,并使用这些经验设计了用于手写彝文识别的卷积神经网络,实验结果表明,此网络在本文所构造的包含100个类数据集上获得了 99.65%的识别率。(3)本文构造并公开了一个手写彝文数据集,用于推动彝文识别研究的发展,设计了一个用于手写彝文识别的原型系统,为彝文研究者以及对彝文感兴趣的学者提供了一种快速阅读彝文文献的途径。综上,本文所提出的基于信息熵和密度的聚类算法以及所获得的卷积神经网络调参经验对其他文字识别问题具有借鉴意义,并且可被用于其他类似的模式识别问题中。此外,通过修改距离度量方法,此聚类算法可被用于更多的非监督学习问题中。
其他文献
给出了概率型制造工程信息的元命题表述方式,提出了面向决策并基于元命题的概率型制造工程信息的全面合成方法。这一方法的特点是对处于同一命题框架和不同命题框架中的不同制
不等错误保护(unequal error protection,UEP)是多媒体数据传输的一个重要举措。在接收状态不理想的情况下,采用不等错误保护技术能够有效地保护传输过程中更重要的数据。利用星座图中信号点高低比特位的不同错误性能,将JPL(jet propulsion laboratory)实验室提出的易于实现且性能优异的原模图低密度奇偶校验码(proto-graph low density p
针对液压防抱死制动系统(anti-lock braking system,ABS)开发过程中遇到的车轮抱死、踏板舒适性不良等实际问题,重点研究液压ABS回油泵的控制策略及其对制动性能的影响。建立了回油泵流量数学模型,轮缸数学模型,并验证了模型的正确性。在AMESim中建立液压系统模型,通过设计仿真实验,对回油泵的开启时间和转速对ABS系统的影响进行了分析,得出了在进入ABS控制时,回油泵首先应保持
<正>“消除体积发酵法”是焙烤工艺方面的重大进展之一,一般成熟的面团,总要进行几个小时的体积发酵,面筋经过一定的化学与物理变化就可成为成熟的面团,同时也具有任意的一延
运用有限元方法对裂纹圆盘进行了动态分析,获得了其振型和位移响应;应用多重分形理论计算和分析了裂纹圆盘的振型、位移响应的广义维数和敏感维数,把广义分形维数、敏感维数作为
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
爱美、追求美是全人类的共同心愿,无论男女老少都希望自己有一个健美的体态,特别是现代高校女大学生。但由于学习、生活、择业的压力过大,身心疲惫,导致体质水平逐步下降,对
为了消除ICA(BSS)估计的幅值、相位及排序等盲不确定性,提出一种基于快速傅里叶变换与最大相关准则分析的ICA(BSS)估计源自适应校正方法。借助对原始传感观测及估计源的频谱分析,近
毕淑敏小说内容平实、贴近生活,并且尤其关注儿童、女性、病人及军人等群体在当前社会条件下的生存意义。本文主要从人物特色、语言特色、题材特色及叙事特色等角度对毕淑敏