论文部分内容阅读
随着Web技术和数据挖掘技术的广泛发展,越来越多的基于电子商务技术的组织从对网站交易数据和点击数据的深入洞察中获益。因此如何对这些数据进行分析和挖掘,充分了解客户的喜好和购买模式,设计出满足不同客户群体需要的个性化网站,从而增加竞争力,已经变得势在必行。
本文针对数据挖掘技术在电子商务网站优化中的应用,重点分析了Web访问模式挖掘和推荐技术的研究,并以2010年上海世博会官方网站为依托,设计开发了“世博网站优化工具”。该工具可以为网站结构离线调整做出建议和进行商品实时推荐。
本文主要工作成果为:
1) 提出了一个针对电子商务网站用户访问模式挖掘的方法依据包含从数据收集,到数据清理,用户识别,会话分割,频繁模式挖掘算法以及模式应用等各个阶段,并对已有相关研究各自的优势,弱点及可能的解决方案等作了深入探讨;
2) 提出了一种基于修正评分矩阵的协同过滤推荐改进算法。传统的协同过滤方法在面对“数据稀疏”时,推荐质量会急剧下降。本文提出的改进算法首先量化用户对评分项的隐式兴趣度,并将这种度量与用户的显式评分矩阵相结合。在修正后的评分矩阵基础上,根据用户角色和评分项的语义信息进行降维,从而提高了推荐效果;
3) 针对世博网站,设计和实现站点结构优化工具。通过该工具,可以收集用户访问日志和站点结构数据,并使用日志清理工具上述数据进行清理和转换。站点结构工具使用这些数据分析站点页面的访问情况,并根据这些结果调整网站的链接拓扑,以给用户提供便捷易用的链接,优化网站结构。另外该工具还具体实现了一个自顶向下的频繁访问模式挖掘算法;
4) 设计和实现了世博网站推荐系统,该系统具有良好的开放性,能同时支持多种推荐功能。该系统实现了关联推荐,热门推荐,改进的协同过滤推荐等多种推荐方法。