基于深度神经网络的手绘草图语义解析与识别技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:averyhut
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手绘草图是一种简洁且高效的表达方式,在人类社会漫长的发展中扮演着重要的角色,方便了人们交流和信息传递。现代社会中,手绘草图被广泛用于设计创作领域,比如动画卡通、建筑设计、服装设计等。然而,现有的计算机辅助设计系统需要人们在完成手绘草图创作之后,继续对该草图进行手工的语义标注操作,这是由于计算机还不能准确地解释手绘草图中人们表达的语义信息。如何利用计算机实现自动且高效地对手绘草图进行精准地语义解析与识别,进而提升相关从业人员的工作效率,是一项极具意义和挑战性的前沿课题。
  手绘草图语义解析与识别任务面临着两个主要挑战:特征少和样本少。(1)与真实的自然图像相比,手绘草图仅由长短不一的线条笔画构成,不包含纹理及颜色信息。而且,手绘草图比较抽象且多样,传统的手工设计特征难以准确地表示手绘草图;(2)人们只需按下拍照键便可获取自然图像数据,而手绘草图是人们一笔一笔绘画创作而得,草图数据的收集难度大于自然图像。因此,现有的草图数据集都是小样本数据集。针对这些挑战,本文以数据表示、手绘草图特性、深度神经网络结构等为出发点,研究手绘草图语义解析与识别技术。本文的主要研究内容和创新性成果包括以下四个方面:
  首先,本文提出了基于双神经网络的手绘草图语义解析方法。现有研究表明大尺寸卷积核适合提取手绘草图中的特征,不过该研究的重点为手绘草图识别任务。与之不同,手绘草图语义解析任务是预测每条笔画的标签,而不是预测整个草图的标签,大尺寸卷积核并不适合处理短笔画。为此,本文的双分支网络采用大、小尺寸的卷积核,分别处理长、短笔画。为解决输入图像中笔画的位置不明确,本文提出将最小矩形包围盒和笔画融合,作为神经网络的输入图像。实验结果和分析表明,本文提出的数据融合表示和双神经网络结构有效提高了解析正确率。
  其次,本文提出了基于神经网络和条件随机场的手绘草图语义解析方法。现有研究表明利用笔画之间关系可以提高手绘草图语义解析的正确率,不过该研究只考虑了笔画的空间关系,不能保证概率图的连通性,同时该研究采用表示能力有限的手工设计特征。与之不同,本文提出同时利用笔画的空间和时序关系,构建连通的概率图模型,同时利用卷积神经网络对输入图像进行特征学习。为解决笔画输入图像提供信息有限,本文提出将笔画和草图融合构成输入图像,增强位置和草图信息。实验结果和分析表明,本文的方法优于现有的其他方法。
  接着,本文提出了基于深度迁移学习的手绘草图语义解析方法。本文利用丰富的自然图像数据,预训练出一个强大的卷积神经网络模型,然后采用有效的微调技术预测笔画的标签。为了改善迁移学习过程中的微调效果,本文提出在卷积神经网络中增加分组卷积层,使卷积神经网络的表征能力增强。与其他方法相比,实验结果在抽象草图数据集上获得了9.7%的提升,在能对应三维网格的草图数据集上获得了2%的提升。
  最后,本文提出了基于像素和点集卷积的低分辨率草图图像识别方法。使用深度神经网络进行草图识别已经成为一种新研究趋势。然而,传统的基于像素(图像)的卷积神经网络,因图像细节的丢失,导致对低分辨率草图图像的识别性能较差。为了解决这一问题,本文提出了一种基于联合像素和点集的卷积神经网络,用于低分辨率草图图像识别。该网络同时配备了图像卷积和点集卷积,可以同时处理草图的图像和点集表示。此外,本文提出了一个混合分类器,一个相应的损失函数和一个训练策略,以更好地提取特征进行识别。实验结果表明,本文的方法优于其他的深度神经网络。
其他文献
随着智能设备和社交媒体的快速发展,电商平台已经成为人们日常生活中不可缺少的组成部分。面对日益激增的交易数据,推荐系统有利于用户更快地筛选产品。在现在的电子商务领域中,在线评论和打分信息能够帮助用户进行更好的购买决策,因此,如何更好地利用这些信息成为一个关键的挑战。近年来,已经有大量的研究人员开始致力于探索用户的评论、打分、偏好和行为信息,深入挖掘用户的喜好,从而为用户进行更加个性化的推荐。
  然而,现有的研究对用户偏好和商品属性的动态演化尚缺少深入理解和量化分析。此外,现有研究还没有进行方面级的细
营口市站前区坚持把问题导向贯穿党的建设制度改革全过程,通过找准症结、开好药方、提实措施,不断强化顶层设计、系统设计、制度设计,做实新时代组织工作的“点、线、面”。   把好用人源头关,定好政治过硬“中心点”。紧盯干部群众最关心、最关切、最关注的干部选拔任用工作,认真执行新修订的《党政干部选拔任用工作条例》和省委“一个意见、七个办法、两个通知”规定,坚决把好人选政治关、作风关、能力关、廉洁关。进一步
期刊
自从PDF文档问世以来,以其诸多的优良特性已经在学术界和工业界被广泛的使用。大量的文档资料以PDF格式被存档,读者只需要借助任意的PDF阅读器就可以方便的浏览其中所包含的信息。随着科技和文化的飞速发展,学术界已经积累了海量以PDF格式存档的论文,这其中绝大多数的论文内容的排版结构都是可以适配于PC端,在PC端可以渲染出良好的效果。目前移动互联网时代已经来临,各式各样的移动设备已经普及,由于移动设备
随着社会信息化地不断加深,无论是个人还是企业都坐拥着越来越多的数字化信息,信息量的持续增加加重了数据拥有者的管理负担,因此数据管理服务开始成为一种商业概念。随着云计算技术的发展,云平台的大容量、易部署、管理价格低廉等特点使之成为了数据存储服务的优秀提供商。云存储服务不但降低了数据拥有者的数据管理成本,而且提供了多种便捷的数据访问方式。但是如何在不可信的云服务商面前保证数据安全与隐私依然是亟待解决的一大问题,可搜索对称加密领域的研究试图解决这一难题。
  可搜索对称加密要求在外包数据前进行加密,并支持
习近平总书记在庆祝中国共产党成立100周年大会上的重要讲话,是闪耀着马克思主义真理光芒、真理力量的纲领性文献,是新时代中国共产党人不忘初心、牢记使命的政治宣言,是我们党团结带领人民以史为鉴、开创未来的行动指南。辽宁省直机关工委注重从百年党史和伟大建党精神中汲取强大力量,扎实推动省直机关党的建设高质量发展。  坚持党的领导  坚决做到“两个维护”   办好中国的事情关键在党。没有中国共产党,就没有新
期刊
随着车载GPS设备的大量安装和普遍使用,人们可以方便的获取海量车辆轨迹数据。这些轨迹数据集可潜在反映城市路网、人类出行行为以及城市交通动态等等,由此吸引了大量研究人员使用各种数据挖掘技术力求从这些数据中提取有价值的信息,为城市规划、智能交通、环境保护以及生物病毒传播遏制等领域实现许多创新应用。本文以私家车轨迹数据集为基础,研究了一种新的路网推理机制,据此挖掘和分析了个人出行模式、人群整体出行模式和城市间人群交互特征。
  路网是导航、辅助驾驶以及自动驾驶技术必不可少的一部分。车辆的GPS轨迹可反映潜
随着经济的持续快速发展,中国汽车保有量的持续增长与有限的城市道路资源之间的矛盾日益加剧。在汽车保有量中,私家车所占比例尤为突出。在中国,据公安部的统计,截至2019年12月31日,中国汽车保有量已增加到2.6亿辆,与2018年底相比,增加了2122万辆,增长比为8.83%。随着汽车的持续增加,将进一步加剧城市交通拥堵等问题。随着定位技术,信息处理和数据挖掘等技术的发展,为获取私家车大规模的轨迹数据带来了便利。在当今的智能交通系统中,大规模的车辆轨迹数据具有很高的利用价值。在大多数情况下,广泛使用的GPS(
与其他国家搞的多党制、两党制、一党制不同,中国实行的是中国共产党领导的多党合作和政治协商制度。这是一种具有中国特色的新型政党制度,与中国的国家性质及国情是比较吻合的。  中国政党制度模式选择   在当代中国,除中国共产党外,还有八个民主党派。这些党派诞生于20世纪三四十年代,并从一开始就与中国共产党建立了互济互助的合作关系。   中国共产党在领导新民主主义革命走向胜利的伟大斗争中,确立了在中国各种
期刊
忆阻器具有非易失性,能很好地模拟神经突触,从而被广泛地运用于神经网络中。基于忆阻器的良好特性,用忆阻器替换传统神经网络电路模拟中的电阻可以构建新型神经网络,即忆阻神经网络。因为同步、多稳定性等动力学行为在安全通信、图像加密、联想记忆存储等领域具有广泛的应用前景,从而忆阻神经网络的同步及多稳定性受到国内外学者们密切关注。此外,不同的忆阻神经网络模型也有不同的应用场景,如二阶忆阻神经网络中引入的惯性项通常是产生更加复杂的分叉与混沌行为的一个关键因素。由于忆阻神经网络在电路模拟过程中,放大器等元件不可避免的存在
习近平总书记在中央党校(国家行政学院)中青年干部培训班开班式的讲话中指出,凡是有利于党和人民的事,我们就要事不避难、义不逃责,大胆地干、坚决地干。这一重要指示,就要求新时代党员干部要有新担当新作为,以行动彰显实干、以实干扛起担当,干出一番事业、擎起一片蓝天。   要有忠诚于党的坚定信念。要让群众看得出,就要有坚定的理想信念,矢志不渝的事业追求。不可否认,现实中有的党员信仰发生偏移,不信马列信鬼神,
期刊