Web日志挖掘中负关联规则的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wukuang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet的用户行为分析主要是基于Web数据挖掘,Web数据挖掘是使用数据挖掘或机器学习的方法从Web文档中抽取出用户感兴趣的潜在有用模式和信息。Web数据挖掘分为Web内容挖掘、Web结构挖掘、Web使用挖掘(Web日志挖掘)。本文主要研究负关联规则在Web使用挖掘中的应用。首先介绍了Web数据挖掘的含义和分类,接着说明了Web使用挖掘的概念,以及Web挖掘的流程。其次,初步探讨了负关联规则的相关概念,简单介绍了负关联规则的定义及性质,引出了强负关联规则的概念,接着介绍了负关联规则的支持度、置信度的计算方法,并给了负关联规则的挖掘步骤。再次,本文对负关联规则的算法进行了深入的探讨和研究。负关联规则的挖掘分为两个部分非频繁项集的挖掘和负关联规则的挖掘,本文对二者都进行了深入讨论。在探讨非频繁项集挖掘时通过对传统挖掘算法进行改进,并结合模式树的概念提出了新的非频繁项集挖掘算法MINE_FI_IFI:在讨论负关联规则挖掘算法时,结合模式树、相关度及CPIR的性质提出新的正负关联规则挖掘算法MINE_P_N_RULES.第四,本文基于Web日志挖掘的理论和本文提出的负关联规则算法的理论给出了Web日志挖掘中中负关联规则挖掘的原型系统的实现,详细说明了原型系统的主要功能模块以及各个功能模块中的实现方式,并利用原型系统对NASA-HTTP数据集进行了负关联规则的挖掘,并给出了系统关键部分的实现。最后,本文进行了实验结果的对比与分析,通过理论的方式阐述了产生实验结果的原因。
其他文献
可逆水印技术是指水印被提取之后,原始数据能够完全恢复,主要应用于对图像的完整性和真实性要求高的领域,如法律仲裁、医学、军事等。随着三维建模技术的发展,网格水印技术受
随着信息科技的飞速发展,在信用卡欺诈监测、网络流量监控和在线金融交易等场景中产生了大量的数据流。这些数据流中蕴含着大量有价值的信息,为了获取这些信息,人们开展了大
人脸检测技术在人们日常生活中越来越受到关注,特别是在学术研究、国防等领域,每年正以突飞猛进的速度发展壮大。人脸检测是一项综合了多学科、多领域、多层次的高新复合型技术
随着人们对安全问题的重视,监控系统变得无所不在。利用监控系统信息进行人的身份识别变得非常迫切。步态识别,即利用人走路的姿势进行身份识别,是一种新兴的生物特征识别技
近年来,大部分企业已经完成业务数据信息化,各企业都搭建了自己的数据存储系统来存放自身业务数据。企业兼并引起的数据库合并,跨数据库查询服务,数据集成等应用都依赖异构数
随着互联网技术的进步和发展,Web包含了越来越多的丰富信息,从而使Web成为了一个巨大的、分布广泛的、全球化的在线信息源。尤其是近些年来,各式各样的大型数据库逐渐建立起
随着人脸识别技术的日趋成熟,其商业化应用也愈加广泛。不过,随着该技术的不断应用,也出现了十分严重的安全问题。现在,几乎所有的人脸识别系统均无法甄别人脸的真假,也就是
随着互联网的高速发展,Internet在我们日常的生活中扮演越来越重要的角色,成为我们生活和工作中必不可少的一部分。网络的高速发展带来了网络信息的爆炸式增长,而网络用户对
移动Ad Hoc网络的研究已成为网络领域中的重要研究方向,相关路由协议的设计和性能研究工作逐渐成为热点,一个能够对Ad Hoc网络路由协议进行全面性分析的性能评估方法显得越来
由于现代计算机硬件技术、互联网技术以及多媒体信息技术的高速发展,人们所拥有的数据量已经达到了前所未有的规模,而数据挖掘技术的出现使得对大量的库存数据进行有针对性地处