基于关联规则的Web日志挖掘研究与实现

来源 :南昌大学 | 被引量 : 0次 | 上传用户:dy911615
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web日志挖掘是Web数据挖掘中非常重要的一个研究领域和研究方向,通过分析和发现Web日志记录中的规律,可以挖掘出Web用户潜在的使用规律和模式,这可被广泛用于发现电子商务中的潜在客户、提高Web服务的质量和效率以及优化企业信息门户性能等领域。本文介绍了Internet的发展状况及Web数据挖掘的产生背景,系统地阐述了数据挖掘技术与Web数据挖掘的思想、理论、技术、方法和策略,对Web日志数据挖掘过程及其中各环节的关键技术进行了深入的探讨,重点研究了Web日志挖掘的数据预处理技术和关联规则及基于关联规则的算法,并将其用于指导实际系统的构建。在Web日志数据预处理方面,在分析比较前人已有的各种方法基础上,将统一建模语言(UML)引入到对Web日志预处理过程的建模上,使用UML对预处理的过程各步骤进行建模,设计出相关数据库表,并在此基础上给出了简明清晰的算法实现。在关联规则及基于关联规则算法研究方面,本文分析了经典的基于关联规则的挖掘算法Apriori的特点,找出算法存在的不足,并对其进行了改进和优化,使其具有更高的效率。在对Web日志挖掘理论和技术研究的基础上,结合当前的主流开发技术平台,设计和实现了Web日志挖掘实验系统WebLogMiner,并用其对Web服务器的日志记录进行挖掘实验,得到较为理想的结果。
其他文献
句法分析的基本任务是确定句子的句法结构,由于语言的复杂性,句法结构往往有歧义的存在,需要引入大量信息来减少歧义,提高句法分析结果。句法分析一般分为短语结构句法分析和
随着信息技术的迅速发展,高维数据在社会科学和自然科学研究领域广泛出现,一方面带来了更多可用信息,另一方面给数据的处理分析带来了巨大挑战。尤其是随着数据挖掘技术的广
在人机交互领域中,传统的单语音识别技术在相对安静的环境下能够对连续的单词及词组达到较高的识别率。然而,将其应用到有背景噪声或多人交互的真实环境时,其识别能力受到了极大
任意波形发生器(Arbitrary Waveform Generator简称AWG)是一种常用信号源,是现代电子测试领域内应用最为广泛的常用仪器之一。由于它可以产生包括各种理想及非理想的波形信号,因此广泛用于通信、雷达、导航、宇航等领域。AWG除了可以产生纯净的正弦波、方波、三角波等常规波形外,也可以产生线性调频、调相、调幅信号以及程控占空比的低占空比方波,还可以根据用户测试需求生成任意波形和噪声
随着企业信息化地位的提高,传统的企业开发平台正面临着严峻的挑战。现代的企业信息系统业务逻辑多变、安全要求高、管理数据多,要求开发平台提供足够的灵活性来适应现代企业
随着微机电系统(Micro-Electro-Mechanical Systems,MEMS)技术、无线通信和数字电子技术方面的进步和日益成熟,产生了无线传感器网络(Wireless Sensor Network,WSN)。无线传
本文主要讨论多播安全的一个核心问题——组密钥管理。多播是Internet上许多应用的基础,已经成为当前研究的一个热点问题,组通信密钥的安全是其中急需解决的问题,最为核心的
软件复用是解决软件危机、实现软件开发工业化生产的有效途径。构件的分类和检索是软件复用技术的基础,良好的分类方法和高效的检索方法能大大降低软件复用成本。一个有效的构
飞机故障预警是飞机维护工作中的难点问题,由于快速存取记录器(Quick Access Recorder,以下简称QAR)所记录的数据具有取换方便,存储量大等特点,分析QAR数据便成为飞机故障预
近年来,web服务作为一种新兴的web应用模式,发展非常迅速。随着web服务的增多,在海量的web服务中准备而有效地找到满足需求的服务的重要性显得愈加突出。传统的web服务发现主