Web使用挖掘方法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:striving123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先概述了数据挖掘的基本原理;接着对Web挖掘的基本概念、分类和研究内容进行概述,然后重点讨论了Web使用挖掘的过程、任务和研究现状.并在此基础上,明确了Web使用挖掘的研究难点在于:如何对原始日志数据进行预处理;如何设计有效的挖掘算法和模型来得到有价值的用户访问模式.在数据预处理方面,该文设计实现了一个Web使用数据挖掘预处理工具——WUMPA,同时还提出了一个新的会话管理算法;在模式挖掘方面,为更好地了解用户的浏览模式,该文针对Web用户的访问特点,提出了一个基于垂直数据格式的频繁路径挖掘算法VFP,并用实验证明了其有效性.同时,针对Web使用挖掘中现有聚类模型的不足,提出了一个新的聚类模型——频繁路径特征模型(简称FPFM模型),从而提高了会话聚类的有效性.
其他文献
分析目前高性能计算的几种主流技术,并以此为基础指出网格计算是高性能计算领域中一次伟大的浪潮,计算正面临着从集群向网格的过渡。侧重介绍网格计算技术的思想和内涵、网格计
该论文采用内存零拷贝及改进的Raw I/O技术,解决了100MB/s网络环境中,基于Intel X86 PC系统对网络数据包的捕获、存储难以满足100MB/s网络流量的问题,通过设计分布式并发取证
三维网格是计算机图形学领域中用来模拟三维模型的主要方式。近年来随着三维扫描技术和三维建模技术的发展,三维模型的数据规模也越来越大,很多高分辨率的三维模型都用具有成千
随着计算机网络技术的发展和分布式应用的迅速普及,将应用从客户端/服务器模型向客户端/中间件/服务器三层模型进行转移已成为用户的迫切需求,也是当今计算机技术发展的一个主流趋
为了解决"数据丰富而知识贫乏"的问题,我们需要对海量的Web数据进行数据挖掘,用以从因特网上发现有用的知识.但Web数据挖掘比单个数据仓库的挖掘要复杂的多,其主要原因在于We
该文对将反射机制融入中间件技术进行了研究,并对反射机制中的具体化进行语义分析,从语义的角度理解反射的概念.文中给出了一个计算系统,称为RCL(Reflective Computional Log
该文的工作重点是从具有静止背景的视频序列中提取前景运动物体.在对比国内外关于对象分割算法性能的基础上,并结合静止背景的视频序列的特点,采用基于变化检测的分割方法来
该文尝试探讨将演化算法与细胞自动机相结合,研究一类基于细胞自动机的演化算法,以充分发挥计算机和算法的高效运行能力.该文首先扩充细胞自动机概念,提出了演化细胞自动机的
多视点视频作为一种新型的数字媒体,通过提供多个视点的视频数据使用户自由选择视点从多个角度观看三维立体场景,其独特的立体感和视点间交互功能使它广泛应用于三维电视和自由
信息隐藏是保证图像安全的技术之一,信息隐藏理论与密码学不同,它主要考虑怎么把一个秘密消息隐藏到一个普通消息中,继而通过对普通消息的传输来传递隐秘消息。对手不能判断普通