论文部分内容阅读
近年来,随着多媒体技术飞速发展,越来越多的蒙古文古籍文献被扫描转化为数字图像,以便长久保存。这样做不仅有利于古籍文献的保存,同时也给相关研究人员提供了十分珍贵的研究史料。但是,图像格式的文档并没有保存相关索引信息,无法实现文档全文搜索,间接的制约了蒙古文古籍文献的传播与利用。因此,本文将关注蒙古文的古籍图像检索技术研究,为高效利用蒙古文古籍文献提供便利。在图像检索领域,深度学习(Deep Learning,DL)技术已经在图像检索领域得到广泛应用,众多深度学习经典网络模型被应用到图像特征提取过程中。深度学习过程是通过模拟人脑机制建立多层神经网络并进行数据特征的自动提取过程。卷积神经网络(Convolutional Neural Network,CNN)是深度学习的经典模型之一,由于它的权值共享特性,极大的减少了待学习的自由参数的个数从而提高了学习特征的效率,具有更强的泛化能力。因此,本文将《甘珠尔经》数字图像作为研究对象并使用卷积神经网络模型来提取蒙古文古籍单词图像特征,进而探究基于深度学习的蒙古文古籍图像检索技术。本文所做的具体研究工作如下:(1)针对蒙古文构词特点,本文提出了一种适合于蒙古文古籍单词图像的归一化大小。通过在四种归一化尺寸(分别为28×28、32×32、32×64和32×96)上进行对比,当蒙古文古籍单词图像归一化为32×96时,其检索性能要优于其它三种归一化大小。(2)在深度学习技术框架下,本文提出了一种适合于蒙古文古籍单词图像表示的卷积神经网络模型。在所提出的CNN模型下,每个蒙古文古籍单词图像可被表示成长度相同的特征向量。本文所提出的CNN与LeNet-5、Alex Net、ZFNet、GoogLeNet以及自动编码模型进行了对比,实验结果表明其检索性能优于上述方法。从而证明本文提出的CNN模型在蒙古文古籍单词图像的表示上具有一定的优越性。