论文部分内容阅读
随着互联网的普及,办公自动化的应用内容和技术也在不断的发展。然而,现有自动化办公系统对公文的深度分析和对结构化数据的处理存在不足,无法有效挖掘已有公文处理经验,如何实现办公公文的有效推荐及日常办公的智能辅助已成为亟待解决的问题。本文分析现有公文处理系统,通过对比研究,取长补短,分析并设计了基于文本分类和协同过滤的公文处理系统,同时利用云计算技术,为用户推荐相关公文,为决策系统作辅助。本文主要进行以下方面工作:1.通过分析现有公文处理系统存在的不足,引入文本分类和协同过滤解决其存在的问题,并结合系统的角色分析及应用场景分析,选取合适的文本分类和协同过滤算法应用于公文处理系统。2.分析用户行为,改进决策系统中原始数据矩阵的赋值策略,解决协同过滤算法的冷启动问题。3.针对系统应用场景进行需求分析及架构设计,并基于需求分析进行了模块划分和详细设计工作。此外,将数据库划分为系统基本信息和公文偏好信息两个部分,分别选用Mysq1和MongoDB存储。在对系统基本信息建模时引入星型建模的思想,为系统功能扩展奠定基础。4.搭建系统所需的分布式环境,并根据系统的详细设计,对系统的各个模块进行实现。之后,对系统进行功能及性能测试并对测试结果进行了分析。实验表明,本文设计的公文处理系统在决策系统、安全性、鲁棒性和可扩展性上有一定优势。就决策系统而言,系统为用户提供了推荐功能以及对公文的智能分类,为用户处理公文提供支持。就安全性而言,系统引入权限控制,为其机密性提供保障。就鲁棒性而言,引入了数据库的主从同步规则,保证公文数据不会丢失。就可扩展性而言,公文推荐使用Hadoop进行计算,Hadoop是廉价且便于扩展的。Hadoop对硬件的性能要求不高,并且在不影响系统稳定性的前提下,可以通过配置增加计算节点,方便扩展。