论文部分内容阅读
工作日志是软件外包项目监控项目进展的一个重要手段,它由工作人员填写,汇报项目进展状况和遇到的问题,汇报频度高信息量大,是项目进展月报和周报的补充。工作日志的质量一定程度上体现了过程执行的质量,是对外包项目进展进行监控和追踪的一项重要数据。对工作日志的客观评估能够及时发现外包过程中的偏差,及时纠偏以保证外包方能够交付符合质量要求的系统。但由于数量庞大内容琐碎,工作日志的质量很难依靠人工查看和评估。因此,需要自动化的方法代替人工,为项目提供合理有效的日志质量情况评估,进而为项目过程质量评估及监管提供依据。 现有的日志评价研究,大多针对由机器自动产生的日志,通常是系统或者某些软件对已完成的某种操作的记录,格式较为严格。而工作日志为人工填写,描述方式、内容详尽程度与系统日志有较大差别,难以用统一的规则进行解析,因此现有研究中的日志分析和挖掘方法在本文环境下并不适用。 为了更好的利用人员工作日志的信息,帮助外包单位进行过程监控,本文提出了一种软件外包项目工作日志质量评估方法。该方法针对日志内容的自然语言特性,利用文本挖掘和自然语言处理的知识,对日志内容进行词法分析、依存句法分析、基于LDA(Latent Dirichlet Allocation)的文本相似度分析,将文本内容转化为易于解析的词频、词数、依存关系、考虑语义的文本相似度等数据。然后,通过分析日志质量和数据之间关系,从日志结构、内容、主题相关性等方面提取日志质量特征。通过专家小组标注的方法获得训练数据,使用机器学习分类算法进行模型训练建立日志质量评估模型。最后利用模型开发自动化工具,来完成对日志质量的自动化评估。本文以一个国家核高基项目作为案例,实现了一个具有较高准确率的评估模型,并将方法应用到项目中改进过程评分方法。结果表明,本文的方法能够合理的评估日志质量,为外包单位提供有效的过程质量依据和决策支持。