基于属性重要性的WUM数据预处理方式

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:liongliong484
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了降低Web日志数据的规模,并能从预处理后的数据中发现更有价值的访问模式,在引入知识的信息量的基础上,给出了单个属性相对于属性集的重要性量化值的概念,并采用了操作系统中LRU页面置换算法的思想,提出了基于属性重要性的WUM数据预处理方式。实验证明:该方式可以删除不具有挖掘价值的、因用户短期行为而访问的Web日志记录,剔除掉噪音数据,从而有效减小了日志挖掘的复杂度。
其他文献
如何对彩色图像中的目标进行快速、精确的有效分割是计算机视觉和图像分析的重点和难点。提出了一种基于区域的彩色图像分割方法。该方法首先选择合适的彩色空间,提取出图像中的每个像素点的颜色、纹理、位置等综合特征,形成特征向量空间;在特征空间中,运用改进的ISODATA算法自适应地确定初始聚类数目和聚类中心,然后对图像进行聚类和区域分割,最后抽取出图像区域的特征,并与相类似的方法进行了比较实验。实验结果表明
签密是在一个合理的逻辑步骤内同时完成数字签名和公钥加密两项功能,其计算量和通信成本都远远低于传统的先签名后加密。分析现有的基于身份的签密方案,利用双线性对提出了一
介绍一种基于SMS和Windows Mobile的手持式地理信息汇报系统,探讨了一种利用目前现成的移动通信设施实现对带有GPS定位功能的手持智能设备持有者监控的系统。本系统利用目前流行的短信系统(SMS)作为数据传输手段,传送手持智能设备持有者的地理信息数据。使用SMS传输数据通信可靠,费用低廉,且覆盖范围广。
梨黑星病(Venturia pirina)是砀山酥梨最为严重的病害之一,梨种植户每年因为这种病害遭受了很大的损失。随着农业信息化的发展,国内外目前已有很多关于农业专家系统报道,但关于砀
以太网OAM是一种保障以太网运行管理维护的机制,主要进行以太网连通性检测ETH-CC(Ethernet-Continuity Check)和链路问题的跟踪定位。但是ETH-CC存在自身的缺陷,在维护域相互嵌
针对移动P2P网络中的对等端容易耗尽系统资源、受到拒绝服务攻击等问题,提出了一种访问控制框架。在RBAC模型的基础上提出MT-RBAC访问控制框架,模型使用了空间上下文、信任约束
为了实时地、筒捷地仿真复杂的飞机显控系统,结合其功能特点,提出了一种基于客户朋艮务器(C/S)结构的分布式显控仿真系统设计方案。通过采用C/S结构将显控仿真系统划分为服务器和多
处理器动态电压频率调节技术,对Linux系统中并发任务的性能产生不同程度的变化,从而影响并发任务计算资源分配的公平性.提出了一种利用动态时间片缩放来优化任务公平性的方法,并
syn-flood是拒绝服务攻击中较为常见的一种,它利用建立TCP连接需要进行三次握手的特点,向被攻击者发送大量非法的第一次握手数据包,导致被攻击者建立了大量的处于SYN_RCVD状
在分析Linux系统结构的基础上,描述了将完整的Linux系统向S3C2440平台上移植的关键步骤和过程,并详细介绍了如何建立属于自己的交叉编译环境和制作一个纯yaffs2文件系统的方法.