论文部分内容阅读
近年来,随着面向服务的计算模式和架构的广泛应用,越来越多的Web服务出现在Internet上。许多Web服务具有相同或相似的功能,但是服务质量(Quality of Service,QoS)却参差不齐。面对大量的候选Web服务,服务用户不得不花费大量的时间和精力来挑选既满足功能需求又具有较高质量的服务。因此,为用户推荐合适的高质量Web服务变得越来越重要。以往的Web服务推荐系统一般采用协同过滤方法,即根据其他用户的服务调用记录来为目标用户预测服务的质量,从而为之推荐较高质量的服务。在现实情况中,随着网络上Web服务和服务用户的数量加速增长,一个用户常常只调用很少量的几个Web服务,这造成了服务调用记录和QoS数据的极度稀疏,从而引起当前的Web服务推荐方法在预测服务QoS时精度下降。并且,传统的Web服务推荐方法无法得到QoS预测和服务推荐的置信度。Web服务的QoS通常受到用户和服务位置的影响。基于这一事实,有一些研究工作考虑利用用户或服务的位置信息来更好地预测服务的QoS,在一定程度上可以解决服务QoS数据的稀疏问题。然而,在用户和服务位置分布比较稀疏的情况下,以往利用位置的服务推荐方法在服务QoS预测精度方面也会受到限制。为了结合服务的QoS记录和用户的位置信息,同时提高服务的推荐精度和覆盖率,本文提出了一种基于随机游走模型的Web服务推荐方法。本文的主要贡献如下:(1)提出了一种随机游走模型和相应的服务推荐方法,结合了用户位置信息和协同过滤技术来预测Web服务的QoS。该方法包含两个阶段。第一阶段利用用户的地理位置信息,并考虑用户之间的相似性构建用户网络。第二阶段在该网络上执行随机游走算法,每次游走为目标用户和目标服务计算一个QoS预测值,直到满足终止条件为止,最后汇总这些QoS预测值来计算结果。我们的方法能够有效解决Web服务数据稀疏性问题和冷启动问题,提高了服务推荐的覆盖率,在一定程度上也提高了服务推荐的精度。且该方法允许我们定义和测量推荐结果的置信度。为了评估我们提出方法的性能,在一个真实的Web服务数据集上进行了一系列全面的实验,并和已存在的协同过滤方法作了比较。结果显示了所提方法的优越性。(2)通过扩展上述基于随机游走的Web服务推荐方法,提出了一种Web服务QoS区间预测方法。现实中Web服务的QoS值往往是不确定的、动态变化的,容易受到用户位置、网络状态和服务负载的影响。用单一的点值预测Web服务的QoS不能完全反映服务的真实情况,可信度也不高,因此使用区间来估算Web服务的QoS值十分必要。本文提出的Web服务QoS区间预测方法,能够在用户给定QoS区间长度的条件下,找到置信度最大的QoS区间作为预测结果。在真实数据上的实验验证了所提Web服务QoS区间预测方法的准确性。