论文部分内容阅读
目前的多种站点优化技术中,基于Web使用挖掘技术的站点优化是一个重要的研究方向。
为了让用户更有效率的获取信息,对站点结构进行离线修改是一种行之有效的站点优化策略。现有的离线修改技术基本上都用站点结构作为领域知识指导挖掘或评估访问模式,在访问费用评估方面存在问题。针对这些问题,本文着眼于利用Web使用挖掘技术,根据用户的行为信息优化站点设计,对搜索费用量化、优化算法、系统实现等方面进行了研究。本文的主要工作成果为:
(1)本文提出了一种新颖的计算页面搜寻费用的方法。该方法基于Web日志数据中的搜寻路径统计用户寻找目标花费的平均时间,用该时间量化Web页面的搜寻费用,为识别出非结构性原因带来的Web站点设计失误奠定了基础。
(2)以页面搜索费用的计算为基础,本文提出了一种高速启发式挖掘算法,用于寻找能够降低页面搜索费用的超链接。通过在原有结构上添加或者修改这些超链接,能够有效压缩页面的搜寻路径,降低搜寻费用,从而优化站点的设计。经实验验证,首先,算法是高效的,使用基于覆盖树的数据结构和贪心算法极大地提高了算法的运行速度;其次,挖掘的结果能够提供许多有用的信息,帮助管理者及时发现站点结构设计和页面外观设计中存在的问题,对优化站点有很强的提示作用。
(3)以该算法为核心,本文提出了一个对Web站点设计进行优化的应用框架,介绍了基于该框架的站点优化系统的体系结构、系统功能和实现,并对该方案的实施中出现的若干关键技术问题给与了详细的分析和论述,并提出了解决方案。在实际Web站点上的应用和后续的功能开发结果表明,该系统能够保证数据挖掘技术和Web站点的运营与维护紧密结合,具有优越的性能和良好的可扩展性。