论文部分内容阅读
大型企业、机构等大多有自己的文档标准,并且实际运作过程中都会构建自己的文档生成系统,目前多数系统是通过字处理文档软件和手动操作的方式构建。此外,传统的字处理软件在同一时刻只能对一个文档进行操作,不支持并发执行。随着XML处理技术的发展,Office Open XML渐渐成为字处理文档的公共标准。根据这个标准,Java等一些程序语言为文档操作提供了丰富的API。本文研究基于OOXML (Office OpenXML)的Word文档生成机制,构建一个支持并发的在线文档自动生成系统。主要研究与实现工作如下:(1).模板标签设计:模板文档定义了文档布局和样式信息,这些内容和文档静态数据是文档生成过程中保持不变的部分。模板标签需要告诉文档生成引擎渲染哪些数据和如何生成数据到文档,这也是模板驱动文档生成的实质。模板标签设计采用样式与数据逻辑分离的思想,应用基于OOXML结构的文档,建立独立于文档标签的标签体系以驱动文档生成。(2).文档生成引擎架构:文档生成引擎以模板和数据作为输入,研究模板解析、数据加载、渲染文档、生成文档等核心功能的实现技术和方法,通过分阶段独立运行的机制,不但保证文档生成的可操作性,而且通过调度提高生成文档的效率。(3).并发处理:作为Web服务部署到B/S架构系统,文档自动生成系统能够有效处理并发文档请求是保障系统可用性的关键,研究了采用基于集群的负载均衡调度方法以优化并发文档生成请求的处理。(4).实验验证:通过搭建以Apache和Tomcat为核心的小型集群环境,并结合软件测试重用管理系统中测试过程相关文档的生成场景,测试并发情况下文档自动生成服务系统的性能,分析文档生成引擎的可用性。