论文部分内容阅读
随着各领域科学研究的开展,科技文献数据日益受到相关学者的关注。因为科技文献中隐藏着非常丰富的有价值的信息,对其进行深入挖掘具有重要意义。随着科技文献分析适用的方法越来越多,科技文献分析的应用场景越来越丰富,通过基础方法的组合,可以设计出多种多样的应用。而已有的科技文献服务平台大多是定制化的,其中的应用场景种类均已固定,并不能通过基础算法的重组,扩展新的应用场景。通过将PaaS的平台即服务的思想引入科技文献服务中来,可以很好的解决这个问题。平台中提供多种科技文献分析的基础算法组件,并将它们作为服务对外提供。用户可以根据自身的需求,通过不同基础算法的组合,开发出相应的科技文献应用。本课题的目标是在PaaS平台之上提供面向机构的科研信息挖掘服务。基于此目标,本文的主要内容如下:1.研究并实现了PaaS平台中的核心模块——资源服务化、应用开发环境与应用执行引擎。采用REST技术实现平台资源的服务化。应用开发环境和应用执行引擎在jBPM工作流引擎基础上,结合平台的需求,提出了组件扩展机制,并且改进了应用解析方案。2.针对面向机构的科研信息挖掘服务,研究并实现了支撑该服务所需的基础算法组件:数据导入、论文统计、关键词统计、领域提取、科研合作网络预处理、社团划分,以及影响力分析。3.设计并实现了一个基于PaaS的面向机构的科研信息挖掘服务平台,并且研究了该服务可能的应用场景。研究了开发者以及租户分别在平台上的的业务模型:开发者使用开发工具开发应用,租户通过不同应用的组合与集成,实现自身的分析工具或系统。4.最后通过机构发文统计应用的开发实验,验证了基于PaaS的面向机构的科研信息挖掘服务平台,具有组合基础算法组件完成应用开发的能力。通过机构科研分析工具开发的实验,来验证基于PaaS面向机构的科研信息挖掘服务平台的服务能力。