论文部分内容阅读
Web服务具有强自治、松耦合、粗粒度、开放性和可集成性等特点。Web服务是可以重用的软件模块,只需要很简单的协调,并允许自由的配置。同时Web服务所有公共协约完全使用开放的标准协议进行描述、传输和交换。并能够屏蔽不同平台的差异。随着可用服务数量的增多,越来越多的请求需要通过服务的组合来完成。同时出现了许多不同的服务提供者提供的功能相同但性能各异的服务,对众多服务性能的评估,成为了一个难点。针对这种问题,本文根据服务以往运行的信息,利用数据挖掘技术搜索其中的规律,并根据这些规律预测Web服务的性能,然后依据预测的性能为用户推荐合适的服务。同时本文还提出了以服务运行和网络状态参数为条件的QoS规则前件,以评定QoS表现的参数为结论的QoS规则的后件。这样构成的规则向量可以很好的表示一个服务在当前状态下的QoS表现。最后,本文提到的方法都得到了实现,用到了阶段性优化原型系统中。首先系统实现了服务执行日志与网络状态监测日志的有效集成,使所有的原始数据集具有一个统一的逻辑,方便后续步骤的进行。然后,系统根据皮尔逊相关度计算剔除与QoS参数无关的属性列,减少不必要的挖掘操作。其次,对连续数据类型的条件属性进行监督离散化,将属性值划分为区间,并以标记替换区间内的数值,能够使挖掘结果简洁、易于使用。再次,通过不产生候选频繁项集的FP树算法挖掘数据集产生QoS关联规则,发现条件属性与QoS属性之间具有规律性的联系。最后,系统采用基于QoS关联规则构建的分类器,生成决策表,对Web服务的性能做出预测。