基于生成对抗网络的书法图片生成研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:liubo200987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
书法是中国汉字特有的一种书写载体,从甲骨文、金文、隶书等逐渐发展变化出楷书、草书、行书等书法。现今,使用纸张和碑刻作为书法作品传承的载体非常不易保存。氧化、虫蛀、风蚀等自然因素和战乱、损毁等人为因素都对书法作品保存造成了非常大的影响。所以,使用现今的科学技术对中国的书法古籍和碑文等进行虚拟修复和是非常有意义的工作。在计算机视觉领域中,使用卷积神经网络进行分类和特征提取,使用生成式的神经网络进行图像修复等研究都有着非常优秀的成果。这些理论成果提供了一种更好的修复、保存、弘扬和发展书法文化的途径。现有的图像修复模型通常是使用图片整体信息修复局部性信息。书法图片因为其特殊性,整张图片由许多个字在特定的位置组成。字与字之间位置和语义上有一定的联系,但是两个字的字形之间联系并不大。当书法图片破碎程度较大,现有的图像修复方法无法根据剩余的图片推断出破损位置的字来修复整张图片。针对现有技术存在的不足,本文提出了基于生成对抗网络的书法图片生成模型,根据文本生成相应的书法图片。本文的主要工作如下:1、书法字位置预测。生成书法图片不同于生成单个书法字,此任务需要知道每个书法字在图片中的位置。本文提出的书法位置预测模型根据一段文本预测其在图片中的相对位置。2、结合书法字与位置生成图片。本文使用字编码向量生成书法字的图片,结合为每个字生成的位置预测,将其整合在一张多通道的特征图片上,将这张多通道的图片输入进高清化生成的网络中完成书法字的生成。3、多样性书法字生成模型。本文提出的模型中对书法字的位置预测主要来源于文字编辑成的向量,从而没有很好的泛化能力。在改进的方法中,使用从书法字图片中提取到的特征用于预测书法字的位置坐标。改进的模型对生成的字的笔画的粗细、结构等特征使用神经网络进行分析和提取,最终用于书法字位置的预测。训练好的模型在使用的过程中可以直接分析字的图片预测字的外切矩形的形状,这样不需要模型对每个字都有相应的处理方式。
其他文献
宫颈液基薄层细胞学检测(Thinprep cytologic test,TCT)是进行宫颈癌筛查的重要途径。目标检测算法可以辅助医生对TCT切片中的病变细胞进行定位及分类。但是,训练数据中的缺失标注、训练样本的类别不平衡以及切片中的细胞数量巨大而且特征不统一,导致现有的算法在检测TCT切片中的病变细胞时性能受限。针对这些问题,本文提出了对应的解决方案。工作总结如下:(1)针对缺失标注在网络训练中引
X射线发光断层成像(XLCT)由于一次激发即可同时获得光学信息及解剖结构信息而成为一种具有潜力的分子成像技术,在预临床研究中被广泛关注。光学传输模型和重建算法是影响XLCT性能的两个关键因素,实现XLCT快速准确的重建是实际应用的迫切需求。本研究基于光传输理论和稀疏重建理论,在混合光传输模型与重建算法等方面展开研究。通过构建扩散方程(DE)与三阶简化球谐近似(SP3)的混合模型解决XLCT中光传输
智能移动设备的普及和GPS、北斗定位、智能计算等科学技术的进步,极大地推进了基于位置服务(Location-based services,LBS)的发展,LBS相关应用已经出现在日常生活的方方面面,人们越来越离不开这类服务。然而我们在提供个人位置信息享受这些服务给我们带来的便利同时,也导致了个人位置信息的暴露,甚至是个人身份标识等关联信息的泄露。目前常用的位置隐私保护方法是基于k匿名及其扩展的方法
个性化位置推荐算法研究是近年来一个热门的讨论话题,而社交媒体平台中大量签到数据的收集使得平台向用户提供精准的位置推荐服务成为可能。现有的工作通过研究用户历史签到数据中蕴含的时空信息,向用户提供位置推荐服务。然而现有算法却忽略了用户行为的时间相关性以及同类型位置在空间的聚集分布对用户位置访问的影响;此外,现有算法忽略了用户在跨域位置访问场景下特有的时空访问模式。针对上述问题,本文进行如下研究:(1)
近年来,随着空间感知能力和点云大规模处理技术的愈加成熟,基于激光的三维扫描技术已经广泛应用于实时导航、虚拟现实、建筑信息模型建模等各个领域中,而点云分割技术是面向这些应用领域的必要技术之一。点云分割是对点云模型进行有效利用的关键技术,点云分割技术实现了对点云模型的分而治之,无论是识别还是分类都需要先对点云进行分割提取,提高点云分割精度与效率是目前主要的研究方向。本文提出基于图卷积神经网络的点云特征
文物是最具有代表性文化遗产的瑰宝。由于传统人工复原效率低下,且会对文物造成损坏,使用计算机对文物进行数字化保护与复原成为必要的趋势。其主要应用于对文物碎片分类,匹配,拼接以及孔洞修补。文物碎片数量庞大,形状既不规则又不完整,表面几何纹理特征复杂,如此本文以兵马俑碎片的三维模型作为研究对象,展开对文物碎片的分类相关技术研究,主要的研究内容如下:1.针对三维模型的特征提取只能提取局部表面几何特征,而丢
本文以教育学习理论、教育心理学为指导,采用问卷调查的方法,对江苏省张家港市乐余高级中学高一学生进行了抽样调查和分析,力求从中概括出造成农村高中化学学习成绩差异的非智力因素,并提出了相应的教育教学对策。
在古代瓷器鉴定领域,判定这个瓷器的生产年代、它的烧制窑口、它的所属类别这些问题依旧是陶瓷考古的重要内容。在古代文物的保护与研究过程中,经常会发掘出大量古代瓷器碎片,这些混杂在一起的文物碎片属于不同的类型,来自不同的器物和产自不同的年代,从而加重了碎片分类的工作量,影响了瓷器复原的速度,不便于文物的管理和保护工作。本文围绕古代瓷器碎片的自动分类问题,通过理论分析、数据集制作、方法设计与实验对比,分别
我国寒武系产有非常丰富的古生物微体化石,出现了很多与现代生物完全不同的生物种类,它们对地球上早期生命演化和寒武纪生命大爆发具有非常高的研究价值。但是由于微体化石个体微小,传统的微体化石分拣工作都是通过人工在显微镜下逐个观察挑选完成,该方式效率低下。近年来,图像识别技术在各个领域被广泛研究应用,在此背景下,将图像识别技术引入到微体化石研究工作中,无疑会提供很大的便利。针对不同场景下的微体化石识别问题
JavaScript是一种流行的、平台无关的编程语言,为了保证JavaScript程序在不同平台上的互操作性,JavaScript解释器(即引擎)的实现必须符合ECMAScript-262标准。然而,标准的频繁变动使得引擎开发者往往难以做出及时的更新,从而使JavaScript引擎出现不符合标准的行为,即一致性缺陷。一致性缺陷不但会导致正确的JavaScript脚本在运行后得出错误的结果,还有可能