论文部分内容阅读
本文主要探讨文档格式转换中的关键问题及其解决途径。文档格式转换时解决当前多种文档格式并存,互操作性差的一种有效途径。然而,现有的文档格式转换器的转换能力尚不理想,难以满足用户需求。本课题以前期UOF-OOXML格式转换器的研究成果为基础,对当前格式转换中存在的问题进行深入分析,提炼出对格式转换影响最大的几个关键问题,包括: 1)格式转换中如何尽量保留目标格式不支持的功能? 2)如何处理好文档的显示效果与编辑语义之间的关系? 3)文档格式的转换能力与还原能力如何权衡? 4)如何减少循环转换后信息的冗余,并控制文档数据的增长? 本文首先通过举例的方法以演示文稿文档转换中的几个典型案例对相关问题进行说明;其次,对产生这些问题的原因进行了深入分析和探讨,提出了相应的解决方法;利用“扩展区”记录目标格式不支持的功能,实现循环转换中的信息还原;通过近似转换达到显现效果与编辑能力的兼顾;通过多个功能转换的配合提高文档格式的转换能力;以及通过缺省值、预设值的匹配减少循环转换后信息的冗余。作者将这些方法运用到UOF-OOXML格式转换器演示文稿的转换中,改进了原有转换器的处理能力和性能,取得了较好的效果。 作者通过对转换器的进一步分析,对不同转换策略进行分忻比较,提出文档格式转换需要区别具体转换目的而采取不同转换策略,以期针对特定的功能需求,达到最好的转换效果。进而提出参数化文档格式转换器的设想。该项研究对于各类文档转换器设计均有一定的借鉴意义。