【摘 要】
:
随着Web应用的快速发展,Web数据挖掘正成为数据挖掘的热点之一,根据Web挖掘的目的和数据对象的不同,Web数据挖掘可以分为Web内容挖掘、Web结构挖掘、Web用户访问信息挖掘。we
论文部分内容阅读
随着Web应用的快速发展,Web数据挖掘正成为数据挖掘的热点之一,根据Web挖掘的目的和数据对象的不同,Web数据挖掘可以分为Web内容挖掘、Web结构挖掘、Web用户访问信息挖掘。web用户访问日志数据挖掘就是利用数据挖掘的技术挖掘分析用户访问留下的日志文件,挖掘用户访问模式,为网站经营管理和结构调整提供决策支持;为企业发现新市场机会,进行市场决策;提高通过网站施行的营销效果,以及为企业进行战略决策提供有价值的潜在的信息。数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。数据仓库系统主要包括数据源、数据仓库、OLAP服务、前端工具等组成部分。数据仓库的设计模式有星型模式和雪花模式,设计步骤有概念模型设计、逻辑模型设计、物理模型设计、数据仓库生成、数据仓库运行和维护等。数据挖掘中的序列模式挖掘是数据挖掘的一个重要方向,本文给出了序列模式挖掘的主要算法,并在PrefixSpan算法的基础上提出改进,,实现中通过减少投影数据库的数量对该算法进行了优化,通过M矩阵的构造,用频繁2-序列的投影代替频繁1-序列的投影,减少了投影数据库的数量,同时利用了Aprior性质对投影数据库剪枝,进一步减小了投影数据库的大小,对算法进行了优化。最后对该算法进行了分析并给出实验数据。对Web Log进行数据预处理,得到序列模式挖掘所需的序列模式数据库,建立星型的数据仓库并进行了OLAP分析。最后对序列数据库进行了序列模式挖掘,并对挖掘的结果进行了分析。
其他文献
随着互联网的蓬勃发展,数据的规模不断扩大,从KB量级发展到TB甚至PB量级。如何从海量的数据中快速有效地挖掘出对用户有用的知识,是数据挖掘所面临的一个新的挑战。Hadoop是
近年来,随着云计算的快速发展,越来越多的企业和个人(数据拥有者)将他们的数据放到云服务器中。由于云服务器中数据往往包含一些敏感信息,因此需要保证这些数据安全。一种保证数据
椭圆曲线密码,即基于椭圆曲线离散对数问题的密码体制,于1985年由N Koblitz和V Miller分别提出。椭圆曲线是代数数论、代数几何和解析数论这三门古老且富有活力的数学学科的
随着移动通信的高速发展和因特网用户数目的急剧增加,越来越多的人希望在移动过程中使用移动终端通过无线方式接入因特网,以获取所需的信息。移动通信与因特网的结合导致移动
移动Ad Hoc网络(MANET)是由一系列带有无线收发装置的移动主机节点组成的多跳、没有固定基站和中心节点的临时性自治网络系统。它具有组网快捷、灵活,且不受有线网络约束的特
嵌入式系统日趋复杂化和网络化,因此嵌入式系统的实时性和网络嵌入式设备的安全性面临严峻的挑战。基于此,本文研究了适用于复杂嵌入式系统的实时任务调度问题和嵌入式网络设
在市场经济条件下,企业为了应对竞争需要采用各种方法提高生产率、降低成本和改善管理,而信息技术一直以來都是企业提高竞争力的重要手段之一。随着信息化的深入,企业内部和
随着城市化进程的加快,城市交通网络的规模也在不断扩大,交通设施日益发达,但这也使城市交通变得异常复杂。而且伴随着各种交通管理措施的实行,限高通行、限速通行、禁止通行
模型检测是一种被广泛应用的验证有限状态系统性质的自动化验证技术。经过三十多年的研究发展,时态逻辑LTL和CTL的模型检测问题已经得到了很好的解决。不仅提出了各种高效的
数字水准仪是集光学电子技术、图像处理技术、计算机技术于一体的当代新型水准测量仪器.它具有测量速度快、精度高、操作简便,能显著减轻作业强度等优点,受到了广大测量工作