曲线字库自动生成方法的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:liongliong576
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展,世界信息化已成为发展的大潮,中华文化的数字化、信息化,必须以中华语言文字的信息化为前提。汉字字库是中文信息处理的重要基础,因此字库技术成为这一领域重要的研究课题。字库技术的发展主要经历了三个阶段:点阵字库、向量字库和曲线字库。点阵字库和向量字库的最大缺点就是数据存储量大,并且放大时会出现我们通常说的锯齿现象,为了克服点阵字库和向量字库的缺点,满足高质量汉字显示与打印的需求,人们又开发了曲线字库。曲线字库是当今国际上最流行的一种字库技术,用直线和三次Bezier曲线的集合来描述一个汉字的字形轮廓,既消除了点阵字库和向量字库的局限性,又具有连续性好、美观、变换方便、存储量小等优点,达到了真正的“无级变倍”的效果。目前,在汉字输出表示法方面,虽已多数采用曲线字库,但从向量字到曲线字是人工修改完成的。人工修字工作量大、速度慢、质量不高、生产效率较低,因此研究一种自动生成高质量的曲线字库的方法具有十分重要的实际意义,本文正是从这一实际意义出发,研究了一种高效的方法来实现从向量字形到曲线字形的自动转换。要实现从向量字库到曲线字库的自动转换,需要解决四方面的问题:1.准确提取向量字形轮廓上的关键点本文采用三段式提取关键点法提取向量字形轮廓上的关键点。该方法能够较准确的提取关键点,并能在较好的保持字形特征的前提下,使数据存储量大大减小。2.准确判断分段后的向量段的拟合类型根据基准弧弦距原则判定是用直线段还是用曲线段来替换相应的向量段,从而保证使用尽可能少的关键点来达到最佳的拟合效果。3.反求Bezier曲线控制点,提高曲线拟合的精度对于确定用直线段来代替的向量段,曲线字库中只需存储向量段的两个端点;对于需要用曲线段替代的向量段,则需要存储Bezier曲线的控制点;本文通过最小二乘法由向量段上的向量点反求三次Bezier曲线控制点,提高对向量字形轮廓的拟合精度。由于三次Bezier曲线只需要四个控制点便可灵活控制其曲线形状,所以可以大大减小曲线段数据存储量,从而使整个曲线字库的数量存储量大大减小。4.根据笔画特征提取特征轮廓,优化曲线字库汉字具有结构化的特点,它的最小构成单位是笔画,每种笔画有其特定的风格,所以根据定义笔画的规则提取具有这种笔画特征的轮廓,再按照它所归属的笔画类型微调轮廓上的关键点位置,使相同或相似的笔画轮廓具有相同的分段方法,从而保持了字体的风格一致,达到优化曲线字库的目的。本文首先给出了三段式提取关键点法,这种方法既消除了在对向量字形轮廓进行分段操作时由于字形轮廓上长直线的影响而导致的分段不合理问题,又能最大限度的减少数据存储量;第二,提出基准弧弦距原则,并利用它判断向量段的拟合类型,在保证数据量尽可能小的前提下达到最佳的拟合效果;第三,定义笔画描述规则,依据这些规则较准确的提取特征轮廓,并对相应的关键点进行调整。实验表明,这种曲线字库自动生成方法既能较好的保持字形特征,又能最大限度的减少数据存储量,较好的实现了从向量字形到曲线字形的自动转换。
其他文献
近年来,随着Internet和Intranet/Extranet的快速发展,Web应用被广泛应用到各个领域,Web应用的开发效率及质量要求不断提高,开发工作的难度不断增加。如何快速有效的开发出Web应用
随着多媒体技术以及互联网应用的迅速发展,多媒体数据量特别是视频数据量呈现爆炸式地增长,找到一种行之有效的视频检索方法越来越成为一种必须。高效的视频检索技术能够极大
网上阅卷是一种为提高阅卷自动化、智能化和共享化而兴起的应用,它通过互联网将阅卷客户端和服务器端连接在一起,数据的传输在互联网上进行。因此,研究和开发一种能够保护网
组播通信与单播通信类似,也面临着互联网上潜在的安全问题。有关研究结果给出,结合单播系统中新一代安全标准IPSec,提出了组播安全的相应解决方法,并讨论了安全组播和IPSec的
随着网络上电子文档呈指数级增长,人们迫切需要能利用计算机自动地处理这些文档,主要包括文档的自动分类、聚类和摘要。本文的侧重点是文档聚类。文档聚类的一般过程包括文本
随着计算机技术的高速发展,在日常的生活和工作中,越来越多的人采用图片的方式来记录生活和工作中的点点滴滴,因此保证其安全性已经显得越来越重要。由于图像具有信息量大、
随着用户和应用需求的不断增长,存储系统在规模、体系结构等方面都出现了新的变化,系统正朝着大规模、复杂化的方向飞速发展,随之而来的是为了满足各种存储需求而引起的管理
随着人们对视频和音频信息的需求愈来愈强烈,追求远距离视音频同步交互成为新的时尚。近些年来,依托计算机技术、通信技术和网络技术的发展,集音频、视频、图像、文字、数据为一
近年来云计算吸引了学术界和工业界的广泛关注,随着云计算的迅速发展,世界各地建立起了许多包含成千上万个计算节点的大规模数据中心。云数据中心的运行需要大量的能源消耗,
Web服务是一种优秀的分布式的组件技术,以 XML( eXtensible Markup Language)/SOAP(Simple Object Access Protocol)/WSDL(Web Services Description Language)/UDDI(Univers