基于Capsule网络和迁移学习的甲骨文字形识别

来源 :武汉大学 | 被引量 : 0次 | 上传用户:pdiudiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
甲骨文作为我国至今发现的最早的成熟文字,记录了殷商时期的经济和政治情况,揭示了中国古代的社会面貌,具有重要的文化及学术意义。随着深度学习算法的飞速发展,使用图像识别算法解决甲骨文领域中尚未解决的问题正逐渐成为未来的方向。研究表明,甲骨文存在较为完备的构形系统,每个甲骨文字形都由一个或若干个构件按照特定的规律组成。构形系统是研究甲骨文的关键,具有很高的研究价值。但是,将这种构形规律运用在计算机识别甲骨文的任务中十分困难。本文针对这一问题,对甲骨文字形的构形系统进行了研究,提出了一种基于深度学习架构的新的甲骨文字形的识别方法,利用甲骨文的构形知识提升准确度,并且通过实验验证了其有效性。首先,本文对甲骨文字形以及构件进行了深入的研究,分析了甲骨文构形系统的特点,并探讨了目前通过计算机图像识别技术进行甲骨文识别的难点。针对甲骨文的构件特征提取和字形识别任务,本文建立了两个大型的数据集,分别为甲骨文构件数据集Radical-148,和甲骨文字形数据集Oracle-250。其次,本文设计了一种基于Capsule和迁移学习的模型RadicalNet,用于识别和提取甲骨文的构件。该模型通过甲骨文构件数据集Radical-148进行训练,对甲骨文字形中包含的构件进行多目标识别。在甲骨文构件多目标识别的实验中,最优的模型架构在甲骨文字形数据集Oracle-250上的Top2精确度达到了68.73%,Top5精确度达到了75.02%,这个结果也验证了RadicalNet在甲骨文构件特征提取和识别任务上的有效性。最后,本文设计并实现了两个基于迁移学习的甲骨文字形识别模型OracleNetV1和OracleNetV2。基于RadicalNet提取到的构件特征,对甲骨文字形进行分类,并最终识别出甲骨文的字形类别。OracleNet以甲骨文字形数据集Oracle-250为训练集,在字形识别的最终实验中,OracleNetV1在甲骨文字形测试集Oracle-250上的Top1和Top5准确率分别达到了87.04%和91.18%,OracleNetV2则分别达到了90.73%和93.79%,验证了OracleNet具有高效而稳定的甲骨文字形识别能力。
其他文献
商务英语就是在一定商务环境背景下,进行商务活动时使用的专业英语。它在长期的使用过程中,形成了自己独特的特点,使它更专业化,更富有商业气息,从而与普通英语有较为明显的
财政税收改革对我国高速发展的经济状况具有稳定和促进的作用,因此加快财政税收体制的改革与创新势在必行。本文从我国财政税收体制改革的意义出发,论述了新时期我国财政税收
<正>(三)绿色发展是兰州高质量发展的重要体现主要包括以下"五个绿色"。1.绿色城市:坚持绿色强市战略,建设低碳城市从产业结构优化、能源结构调整、节能技术升级领域推进城市