基于深度学习的东巴文检测识别算法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:jacky1228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国是一个民族多、语言多、文字多统一的多民族国家,千姿百态的文字造就了中华文化的多样性。而如今,很多语言和文字面临消失的危险,保护语言文字的多样性具有重大的历史意义。东巴文是少数民族纳西族使用的文字,如今越来越少的纳西族人能认识和书写这种文字,这导致东巴文面临失传,本文建立基于深度学习的集检测分割和识别于一体的模型,旨在检测和识别自然场景下的手写东巴文图像。首先,本文基于东巴文的文字特点,收集和书写东巴文,构建合理的文字分类的数据集,收集文字种类500个,样本总计3000个。另外,本文收集国内外开源的文本检测数据集作为预训练数据集,收集经书和雕刻的图片并标注,作为再训练数据集,共计30张图片,221个文字。在训练模型和模型推理之前,本文都对图像进行了预处理。处理流程是,将图片拉伸缩放统一的尺寸,使用均值滤波对图像进行平滑操作,使用自适应阈值分割的方法对图像进行二值化操作。其次,本文通过对比论文数据,选取EAST模型作为图像特征提取和融合的模型,另外通过数值实验分析的方式,比较分析并验证了模板匹配法,支持向量机,深度学习等文字识别的方法,最终选择效果最好的深度学习的方法进行识别,实验结果显示,手写东巴文数据集的识别准确率达到100%,自然场景东巴文的识别率达到93.5%。最后通过模型训练和整合得到一个拥有最佳参数的东巴文检测识别模型。
其他文献
石油化工是一个国家工业经济的命脉,在经济飞速发展之下,随着我国石油需求和消费的日益增长,充分利用石油资源将不可避免地成为可持续发展的目标。目前,我国的含油污泥每年平均产量约500万吨,含油污泥量相对较高。若能对其充分的进行资源化综合利用,每年将有可能会大大增加原油的产出量。本文所述调质剂采用的含油污泥处理方法为调质-离心法,使用该法处理含油污泥,以絮凝剂和破乳剂为基础,根据单因素及正交实验制备合成
随着军民融合与创新驱动发展战略的实施,军民融合企业协同创新也受到社会各界的广泛关注。加快推进军民融合企业协同创新发展是实施军民融合战略与创新驱动发展战略的重要举措。在此背景下,对军民融合企业协同创新行为与机制进行研究具有重要的理论与实践意义。本文以军民融合企业为研究对象,构建博弈模型并运用Matlab软件进行仿真分析,研究其协同创新行为与机制。首先,在阐明论文研究背景、研究目的及意义的基础上,梳理
本文介绍了现有烟火药手工混合和机械混合方法,指出了现有方法存在的问题,为此设计并研制出了由动力模块、筛分模块、混合模块、出料模块、机架、安全保障模块、智能控制模块
Pickering乳液是一种由固体颗粒稳定的乳液,现已应用于包封液体酸/碱催化剂构建级联反应系统,Pickering乳液聚合法制备细菌印迹聚合物,以及多孔泡沫材料及模拟天然抗原等领域,但是以功能性微粒制备的开关型Pickering应用于有机废水处理方面的研究甚少,本论文基于光敏性与磁性颗粒制备的两种开关型Pickering乳液的稳定性、乳化性能、稳定/破乳机理、刺激响应性等方面进行了系统的研究,并
随着人民收入的不断提高,城市化发展的加快,城市越来越拥堵,工作压力越来越大,生活节奏加快,城市居民越来越憧憬乡村田园的宁静生活,享受乡村的新鲜空气和美好环境,因而乡村
据工信部统计,2019年第一季度中国移动互联网月活用户的规模达到11.38亿。用户对于互联网的依赖逐渐增强,这不但为移动应用市场带来了巨大的用户体量,也带来了十分广阔的发展
面板数据分位数回归模型具有面板数据的优点,同时也保留了分位数回归的优势,在计量经济学等领域得到了广泛的应用。在实际问题的研究中,时常会遇到含有内生性的变量,如果忽略变量的内生性问题,其估计结果必然会出现偏差。因此,本文针对含内生变量的面板数据回归模型,提出一种改进的两阶段分位数回归估计。其主要工作如下:首先,引入工具变量消除模型的内生性问题,用复合分位数回归估计得到内生解释变量的估计值。其次,通过
学位
耕地是在人民生活生产中皆扮演着相当重要角色的一种土地利用类型,亦是人类生存和发展过程中最主要的基本生产资料。一个地区耕地集约利用水平的高低,直接影响着当地的综合效益和粮食产量。本文选择了以投入强度,耕作状态和利用效率作为准则层,综合考虑各项因素后选取了9项评价指标,以省域为纵向市域为横向作为研究体系,运用Excel软件对1998-2017年间的黑龙江省,吉林省和辽宁省这三个省份的基础数据、东北地区
在知识经济时代,技术创新是企业提升核心竞争力的重要因素,更是现代服务业这类科技知识含量高的企业发展的关键。为了促进现代服务业等行业的进一步发展,我国实行了营改增这一税改政策,基于税收效应理论和内生生长理论,政府的税收政策会影响企业的行为,那么营改增是否会影响企业的技术创新活动?探究营改增对现代服务业技术创新的影响,对我国今后税收制度改革的进一步深化,行业发展政策的制定,有重要的参考意义。已有关于营
声学功能材料——声子晶体,凭借着带隙特性在减振降噪方面具有极大潜力。传统的布拉格型声子晶体带隙高,不能满足日常生活中250Hz以下的低频振动与噪声抑制需求。局域共振型声子晶体,由于存在低频的共振单元,抑制某些频段的弹性波传播,从而可获的低频带隙。一经提出就获得了极大的关注,涌现出众多声子晶体结构。然而,迄今为止,在声子晶体带隙结构优化方面鲜有探索性研究。本论文尝试解决以上问题,开展基于新型局域共振