论文部分内容阅读
个性化Web服务推荐是服务计算领域的重要研究内容,其包含两个核心问题:QoS缺失数据的预测以及适应用户偏好的QoS多属性综合评价。问题一是由于很多被推荐的Web服务对用户是陌生的(即未被该用户使用过),造成用户相关的QoS属性值缺失。因此需要对其进行预测以对Web服务推荐提供全面的数据支持;问题二是因为Web服务一般具有多个QoS属性,而不同用户对每个QoS属性的要求(通常称之为用户偏好)又不尽相同,造成用户个性化需求的多样性。因此,准确的个性化推荐需要在考虑用户偏好的基础上对Web服务的多QoS属性进行合理地综合评价,以保障所推荐的Web服务能够使用户满意。以上两个问题虽然已经获得了广泛关注并取得了很多研究成果,但是在QoS缺失数据预测的准确性以及QoS综合评价的合理性等方面仍存在诸多不足,因此,本文针对这两个Web服务推荐中的核心问题进行了深入研究并取得了如下成果:1.在无时空信息环境下,已有的QoS预测方法大都借鉴了传统服务推荐(如电影、音乐以及购物相关的服务推荐)中的协同过滤方法,但没有意识到传统的协同过滤方法起源于主观数据的处理,而Web服务QoS数据是客观数据,将协同过滤的思想简单借鉴到Web服务QoS预测中可能会产生较大的误差。针对该问题,本文通过大量实验首次发现了QOS数据的一些重要特征,并基于这些特征对传统的协同过滤方法进行了本质的改进,以适应无时空约束情况下的QoS缺失数据预测,并取得了很高的预测精度。2.在高维时空条件下,已有的QoS预测方法大都针对某一特定的维度,而忽略了高维QoS数据的整体信息,导致了预测精度不高、扩展性不强(即针对不同维度的预测方法不能通用)以及不易应用(即同时考虑多个维度时方法非常复杂)等缺点。针对该问题,本文利用多重线性代数中的重要概念“张量”对高维QoS数据进行建模,整体并统一地处理各个维度;并设计了张量分解与重构等重要操作的优化算法,以实现在任意维度上对QoS缺失数据进行准确及方便地预测。3.用户的个性化需求一般由用户偏好来体现,目前已有的QoS综合评价方法在用户偏好的处理上存在不足,不能准确地获取用户偏好。针对该问题,本文提出了一种基于用户偏好学习的QOS多属性综合评价方法。该方法将用户的历史评分数据作为因变量,将所使用过的Web服务的QoS数据作为自变量,将用户偏好作为自变量参数,建立了用于用户偏好学习的方程组模型,通过求解该方程组可定量、准确地学习出用户偏好,并最终对Web服务QoS做出符合用户偏好的合理评价,以实现个性化的Web服务推荐。4.针对Web服务推荐中的冷启动问题,即历史数据不足导致QoS缺失数据无法准确预测、用户偏好无法准确学习,本文提出了一种基于网络近邻的Web服务推荐方法。通过网络距离测量发现网络近邻;通过网络近邻确定候选Web服务;通过网络近邻实现QoS缺失数据的预测;通过和用户简单交互获取用户偏好;通过综合考虑主客观权重的QoS综合评价方法实现Web服务推荐。该方法解决了冷启动时的两个重要问题:向新用户推荐Web服务;将新的Web服务推荐出去。