基于Web使用挖掘的站点优化技术研究与应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户:mzhou2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前的多种站点优化技术中,基于Web使用挖掘技术的站点优化是一个重要的研究方向。   为了让用户更有效率的获取信息,对站点结构进行离线修改是一种行之有效的站点优化策略。现有的离线修改技术基本上都用站点结构作为领域知识指导挖掘或评估访问模式,在访问费用评估方面存在问题。针对这些问题,本文着眼于利用Web使用挖掘技术,根据用户的行为信息优化站点设计,对搜索费用量化、优化算法、系统实现等方面进行了研究。本文的主要工作成果为:   (1)本文提出了一种新颖的计算页面搜寻费用的方法。该方法基于Web日志数据中的搜寻路径统计用户寻找目标花费的平均时间,用该时间量化Web页面的搜寻费用,为识别出非结构性原因带来的Web站点设计失误奠定了基础。   (2)以页面搜索费用的计算为基础,本文提出了一种高速启发式挖掘算法,用于寻找能够降低页面搜索费用的超链接。通过在原有结构上添加或者修改这些超链接,能够有效压缩页面的搜寻路径,降低搜寻费用,从而优化站点的设计。经实验验证,首先,算法是高效的,使用基于覆盖树的数据结构和贪心算法极大地提高了算法的运行速度;其次,挖掘的结果能够提供许多有用的信息,帮助管理者及时发现站点结构设计和页面外观设计中存在的问题,对优化站点有很强的提示作用。   (3)以该算法为核心,本文提出了一个对Web站点设计进行优化的应用框架,介绍了基于该框架的站点优化系统的体系结构、系统功能和实现,并对该方案的实施中出现的若干关键技术问题给与了详细的分析和论述,并提出了解决方案。在实际Web站点上的应用和后续的功能开发结果表明,该系统能够保证数据挖掘技术和Web站点的运营与维护紧密结合,具有优越的性能和良好的可扩展性。
其他文献
多用户、分时共享是集群系统的基本特点之一,其主要目标是通过高效的资源管理和任务调度技术实现集群范围内资源的有效共享,从而提高资源利用率,获得高性能。 在系统内核层实
针对目前网络上存在的大量不良信息传播的状况,本文提出并实现了一种在电信主干光纤通讯电缆上进行过滤网络信息的引擎。网络信息过滤引擎通过构造相关分类知识库,利用智能信
无线网络中的小区规划不仅影响网络建设成本,而且对无线网络的服务质量有决定性的影响。过去,基站布置和频率分配主要是由工程师依靠经验和实地测试来选择。显然,这种经验往往与
船舶制造业是传统的重型制造业,面对日益激烈的市场竞争和日韩两国信息化造船技术的广泛应用,我国船舶企业必须不断提高响应能力、创新能力以及员工素质才能立于不败之地,如何有