论文部分内容阅读
手绘草图是一种简洁且高效的表达方式,在人类社会漫长的发展中扮演着重要的角色,方便了人们交流和信息传递。现代社会中,手绘草图被广泛用于设计创作领域,比如动画卡通、建筑设计、服装设计等。然而,现有的计算机辅助设计系统需要人们在完成手绘草图创作之后,继续对该草图进行手工的语义标注操作,这是由于计算机还不能准确地解释手绘草图中人们表达的语义信息。如何利用计算机实现自动且高效地对手绘草图进行精准地语义解析与识别,进而提升相关从业人员的工作效率,是一项极具意义和挑战性的前沿课题。
手绘草图语义解析与识别任务面临着两个主要挑战:特征少和样本少。(1)与真实的自然图像相比,手绘草图仅由长短不一的线条笔画构成,不包含纹理及颜色信息。而且,手绘草图比较抽象且多样,传统的手工设计特征难以准确地表示手绘草图;(2)人们只需按下拍照键便可获取自然图像数据,而手绘草图是人们一笔一笔绘画创作而得,草图数据的收集难度大于自然图像。因此,现有的草图数据集都是小样本数据集。针对这些挑战,本文以数据表示、手绘草图特性、深度神经网络结构等为出发点,研究手绘草图语义解析与识别技术。本文的主要研究内容和创新性成果包括以下四个方面:
首先,本文提出了基于双神经网络的手绘草图语义解析方法。现有研究表明大尺寸卷积核适合提取手绘草图中的特征,不过该研究的重点为手绘草图识别任务。与之不同,手绘草图语义解析任务是预测每条笔画的标签,而不是预测整个草图的标签,大尺寸卷积核并不适合处理短笔画。为此,本文的双分支网络采用大、小尺寸的卷积核,分别处理长、短笔画。为解决输入图像中笔画的位置不明确,本文提出将最小矩形包围盒和笔画融合,作为神经网络的输入图像。实验结果和分析表明,本文提出的数据融合表示和双神经网络结构有效提高了解析正确率。
其次,本文提出了基于神经网络和条件随机场的手绘草图语义解析方法。现有研究表明利用笔画之间关系可以提高手绘草图语义解析的正确率,不过该研究只考虑了笔画的空间关系,不能保证概率图的连通性,同时该研究采用表示能力有限的手工设计特征。与之不同,本文提出同时利用笔画的空间和时序关系,构建连通的概率图模型,同时利用卷积神经网络对输入图像进行特征学习。为解决笔画输入图像提供信息有限,本文提出将笔画和草图融合构成输入图像,增强位置和草图信息。实验结果和分析表明,本文的方法优于现有的其他方法。
接着,本文提出了基于深度迁移学习的手绘草图语义解析方法。本文利用丰富的自然图像数据,预训练出一个强大的卷积神经网络模型,然后采用有效的微调技术预测笔画的标签。为了改善迁移学习过程中的微调效果,本文提出在卷积神经网络中增加分组卷积层,使卷积神经网络的表征能力增强。与其他方法相比,实验结果在抽象草图数据集上获得了9.7%的提升,在能对应三维网格的草图数据集上获得了2%的提升。
最后,本文提出了基于像素和点集卷积的低分辨率草图图像识别方法。使用深度神经网络进行草图识别已经成为一种新研究趋势。然而,传统的基于像素(图像)的卷积神经网络,因图像细节的丢失,导致对低分辨率草图图像的识别性能较差。为了解决这一问题,本文提出了一种基于联合像素和点集的卷积神经网络,用于低分辨率草图图像识别。该网络同时配备了图像卷积和点集卷积,可以同时处理草图的图像和点集表示。此外,本文提出了一个混合分类器,一个相应的损失函数和一个训练策略,以更好地提取特征进行识别。实验结果表明,本文的方法优于其他的深度神经网络。
手绘草图语义解析与识别任务面临着两个主要挑战:特征少和样本少。(1)与真实的自然图像相比,手绘草图仅由长短不一的线条笔画构成,不包含纹理及颜色信息。而且,手绘草图比较抽象且多样,传统的手工设计特征难以准确地表示手绘草图;(2)人们只需按下拍照键便可获取自然图像数据,而手绘草图是人们一笔一笔绘画创作而得,草图数据的收集难度大于自然图像。因此,现有的草图数据集都是小样本数据集。针对这些挑战,本文以数据表示、手绘草图特性、深度神经网络结构等为出发点,研究手绘草图语义解析与识别技术。本文的主要研究内容和创新性成果包括以下四个方面:
首先,本文提出了基于双神经网络的手绘草图语义解析方法。现有研究表明大尺寸卷积核适合提取手绘草图中的特征,不过该研究的重点为手绘草图识别任务。与之不同,手绘草图语义解析任务是预测每条笔画的标签,而不是预测整个草图的标签,大尺寸卷积核并不适合处理短笔画。为此,本文的双分支网络采用大、小尺寸的卷积核,分别处理长、短笔画。为解决输入图像中笔画的位置不明确,本文提出将最小矩形包围盒和笔画融合,作为神经网络的输入图像。实验结果和分析表明,本文提出的数据融合表示和双神经网络结构有效提高了解析正确率。
其次,本文提出了基于神经网络和条件随机场的手绘草图语义解析方法。现有研究表明利用笔画之间关系可以提高手绘草图语义解析的正确率,不过该研究只考虑了笔画的空间关系,不能保证概率图的连通性,同时该研究采用表示能力有限的手工设计特征。与之不同,本文提出同时利用笔画的空间和时序关系,构建连通的概率图模型,同时利用卷积神经网络对输入图像进行特征学习。为解决笔画输入图像提供信息有限,本文提出将笔画和草图融合构成输入图像,增强位置和草图信息。实验结果和分析表明,本文的方法优于现有的其他方法。
接着,本文提出了基于深度迁移学习的手绘草图语义解析方法。本文利用丰富的自然图像数据,预训练出一个强大的卷积神经网络模型,然后采用有效的微调技术预测笔画的标签。为了改善迁移学习过程中的微调效果,本文提出在卷积神经网络中增加分组卷积层,使卷积神经网络的表征能力增强。与其他方法相比,实验结果在抽象草图数据集上获得了9.7%的提升,在能对应三维网格的草图数据集上获得了2%的提升。
最后,本文提出了基于像素和点集卷积的低分辨率草图图像识别方法。使用深度神经网络进行草图识别已经成为一种新研究趋势。然而,传统的基于像素(图像)的卷积神经网络,因图像细节的丢失,导致对低分辨率草图图像的识别性能较差。为了解决这一问题,本文提出了一种基于联合像素和点集的卷积神经网络,用于低分辨率草图图像识别。该网络同时配备了图像卷积和点集卷积,可以同时处理草图的图像和点集表示。此外,本文提出了一个混合分类器,一个相应的损失函数和一个训练策略,以更好地提取特征进行识别。实验结果表明,本文的方法优于其他的深度神经网络。