论文部分内容阅读
甲骨文作为我国至今发现的最早的成熟文字,记录了殷商时期的经济和政治情况,揭示了中国古代的社会面貌,具有重要的文化及学术意义。随着深度学习算法的飞速发展,使用图像识别算法解决甲骨文领域中尚未解决的问题正逐渐成为未来的方向。研究表明,甲骨文存在较为完备的构形系统,每个甲骨文字形都由一个或若干个构件按照特定的规律组成。构形系统是研究甲骨文的关键,具有很高的研究价值。但是,将这种构形规律运用在计算机识别甲骨文的任务中十分困难。本文针对这一问题,对甲骨文字形的构形系统进行了研究,提出了一种基于深度学习架构的新的甲骨文字形的识别方法,利用甲骨文的构形知识提升准确度,并且通过实验验证了其有效性。首先,本文对甲骨文字形以及构件进行了深入的研究,分析了甲骨文构形系统的特点,并探讨了目前通过计算机图像识别技术进行甲骨文识别的难点。针对甲骨文的构件特征提取和字形识别任务,本文建立了两个大型的数据集,分别为甲骨文构件数据集Radical-148,和甲骨文字形数据集Oracle-250。其次,本文设计了一种基于Capsule和迁移学习的模型RadicalNet,用于识别和提取甲骨文的构件。该模型通过甲骨文构件数据集Radical-148进行训练,对甲骨文字形中包含的构件进行多目标识别。在甲骨文构件多目标识别的实验中,最优的模型架构在甲骨文字形数据集Oracle-250上的Top2精确度达到了68.73%,Top5精确度达到了75.02%,这个结果也验证了RadicalNet在甲骨文构件特征提取和识别任务上的有效性。最后,本文设计并实现了两个基于迁移学习的甲骨文字形识别模型OracleNetV1和OracleNetV2。基于RadicalNet提取到的构件特征,对甲骨文字形进行分类,并最终识别出甲骨文的字形类别。OracleNet以甲骨文字形数据集Oracle-250为训练集,在字形识别的最终实验中,OracleNetV1在甲骨文字形测试集Oracle-250上的Top1和Top5准确率分别达到了87.04%和91.18%,OracleNetV2则分别达到了90.73%和93.79%,验证了OracleNet具有高效而稳定的甲骨文字形识别能力。