论文部分内容阅读
现今的电子商务网站产生大量的、无序的数据信息,包括用户信息、产品信息、订单信息、web浏览记录、购买记录和评分记录等。然而电子商务推荐系统是网站管理员根据以往的经验进行推荐,导致推荐的页面相似、无创新之处,网站的用户无法在海量的数据中快速找到自己需要的商品,因此基于数据挖掘的协同过滤推荐系统应运而生。 本文引入购买记录挖掘、改进的相似性计算方法-绝对值倒数法和购买商品之间的关联规则等概念,对传统的协同过滤算法进行改进,提高算法的精确性。从而构建采用购买记录挖掘的改进推荐系统,提高推荐的质量。具体的研究工作包括: (1)在传统算法的基础上,引入购买记录挖掘、绝对值倒数法和商品关联规则等对算法进行改进。考虑到数据稀疏性,使用购买记录进行挖掘。购买记录多于评分记录,因此使用购买记录进行挖掘缓解了数据稀疏性,且购买记录更加真实可靠,提高算法的精确性。与Web浏览记录挖掘相比,购买记录挖掘的用户偏好更加客观真实,推荐结果更加精确。使用绝对值倒数法对相似性计算方法进行改进,避免传统方法的缺陷和不足,提高算法的精确性。结合购买商品的关联规则挖掘,寻找购买商品之间的关联规则,确定与目标用户已购买商品存在关联规则的最近邻邻居,进行推荐,提高算法的精确性。并设计改进算法的具体实现过程和详细实现步骤。 (2)将绝对值倒数法与修正的余弦相似性、Pearson相关系数等传统方法进行比较,证明绝对值倒数法的精确性较高。在购买记录挖掘的基础上,将改进算法与传统算法进行比较,使用平均绝对值误差、平均平方误差和标准平均绝对值误差等指标进行实验,证明改进算法的有效性和优越性。 (3)将验证后的改进算法应用于改进推荐系统的构建,进行关联规则的离线挖掘和在线实时推荐,设计改进的推荐系统工作流程,并将其应用于客户关系管理、营销策略等管理实践过程中。