Web日志挖掘中数据预处理的研究

来源 :信息与电脑(理论版) | 被引量 : 0次 | 上传用户:lpucicy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,网络信息量不断增长,Web日志的数据量也在飞速增长,在这样大量的日志中蕴含了非常重要的信息,将数据挖掘技术运用在Web日志的处理中就能发现日志中潜藏的这些信息。本文介绍了Web日志挖掘中数据预处理的方法,论述了数据预处理阶段的主要步骤和方法 With the development of the Internet, the amount of information in the network is constantly increasing, and the amount of data in Web logs is increasing rapidly. In such a large number of logs, very important information is contained. By applying data mining technology to the processing of Web logs, logs can be found In the hidden information. This paper introduces the method of data preprocessing in web log mining, and discusses the main steps and methods of data preprocessing
其他文献
“四人帮”炮制反党影片《春苗》,是他们整个政治阴谋活动的一部分,是紧紧地为他们反革命的修正主义路线服务的。今天,我们揭露“四人帮”及其在文化部的亲信和在上海的余党
使用环介导恒温扩增技术,基于莱姆病病原伯氏疏螺旋体的外膜蛋白A(OspA)基因,针对伯氏疏螺旋体不同的基因型设计特异性引物,对国内主要的莱姆病病原伯氏疏螺旋体的3个基因型
<正>1临床资料1.1一般资料5例病人均为男性,年龄34~58岁,平均年龄45岁。5例病人发病前诱因均有所不同,其中2例发病前有明确的野外毒虫咬伤史,1例饮酒后吸毒,1例食道癌化疗后2
家风是一种精神层面的教育,是一种正面的、积极向上的行为准则,是一种需要潜移默化的教育理念。家训作为中国自古流传下来的一种家庭传统,至今在我们的生活中仍然有着强烈的
1957年4月29日,和煦的晨光、普照大地,嫩绿的杨柳随风荡漾,美丽的北京城,更加显得绚丽多彩。这一天,伟大领袖毛主席要接 April 29, 1957, the warm morning light, shine t
自尊是一个人对自我价值的判断。自尊作为个体自我系统的核心成分之一 ,它的发展状况不仅与个体的心理健康直接相联系 ,对整个人格的发展有重要影响[1] 。本文对不同群体大学
1引言按照国家涉密信息系统建设相关管理规定与标准规范的要求,在国家信息安全保密主管部门的指导下,在涉密技术专业机构与相关安全公司的全力支持下,国土资源部对部机关涉密
目的:大脑中动脉开窗是一种比较罕见的颅内血管变异,常见的检查方法包括CT血管成像、MR血管成像及数字减影血管造影技术等,各种检查方法各有其优缺点,本文就大脑中动脉开窗的
目的了解男男性行为人群(MSM)多性伴和高危性行为现状,探讨该人群高危性行为与生活质量之间的关系,为今后在该人群中开展有效的行为干预提供科学依据。方法采用横断面研究方
本研究考察了婴儿情绪特征、母亲受教育程度和母亲社会情绪行为的关系。结果表明 :(1)情绪特征不同婴儿的母亲在积极社会情绪行为上无显著差异 ,而在消极情绪行为上 ,负性情