【摘 要】
:
知识发现和数据挖掘是人工智能、机器学习、数据库和统计理论等相交叉形成的新学科,目的是从数据库中提取有用的模式,因而具有广阔的应用价值。然而,随着信息技术日新月异的
论文部分内容阅读
知识发现和数据挖掘是人工智能、机器学习、数据库和统计理论等相交叉形成的新学科,目的是从数据库中提取有用的模式,因而具有广阔的应用价值。然而,随着信息技术日新月异的发展,人类生产生活的各个领域都积累了规模庞大的数据,从大规模的数据中高效地提取有用的模式已经成为了一种挑战。为此,并行和分布式的方法成为解决这一问题的一个有效途径受到重视。然而,组织数据的方式和并行处理的方法无论在理论上还是在技术上都有许多问题需要研究。概念格模型具有坚实的理论基础、完备的结构以及并行性的特征,因而成为解决上述问题的一个重要工具。本文针对分布式概念格的模型以及在此基础上的数据挖掘开展研究。 论文的主要工作和贡献如下: 1.概述了知识发现和数据挖掘研究和应用。 2.阐述了概念格的数学基础、传统的概念格研究及概念格的扩展模型和概念格构造,分析了批处理算法和渐进式算法的优缺点。 3.给出了一种新的分布式概念格的模型,提出了与传统分布式数据库中的横向、纵向、混合型分片方式不同的数据有机分割方式,在此基础上给出了便于并行实现的概念格构造算法SEA。该算法结合了批处理算法的并行性和渐进式算法的高效性,使得在进行平行处理的同时又保持了算法的性能。实验表明该算法在时间性能上要明显优于基于原始形式背景的算法(Godin)。 4.在分布式概念格模型的基础上,提出了基于类特征的分类算法。该算法利用基于子全概念的概念格构造算法SEA对每一个类生成子格,通过在各个子格上提取的特征相互之间的协作来实现对新对象的分类。
其他文献
近年来,随着移动互联网和具有定位功能的设备的快速发展,基于位置的服务(LocationBased Service,LBS)已成为人们生活的一部分。随着隐私保护观念的提升,人们在享受位置服务的同时,会
今天越来越多的无线设备开始提供IP连接,移动计算也因此开始流行。当某个节点移动到其他子网时,它希望能够在当前位置继续当前的通信,而不会因为链路的切换而引起通信问题。因为
移动无线传感器网络MWSN(Mobile Wireless Sensor Network)经过多年的发展,已经在军事、环境科学及野生动物监测等领域有了广泛的应用。目前,移动无线传感器网络是许多国家及研
无线自组织网络组网灵活,脱离了固定基础设施的限制,因此得到了广泛的关注。而在实际的应用中,由于物理环境的限制和节点的频繁移动,源节点与目的节点之间很难建立并维护一条稳定
近年来,关于晶体生长的数值模拟与仿真研究已有了很大进展,但由于晶体生长技术和方法的多样性以及生长过程的复杂性,各界对其的研究,大多体现在微观结晶数值求解的算法上,而关于晶
在移动互联网高速发展的今天,随着使用移动终端来获取、存储和处理数据信息的需求日益广泛与深入,传统的移动终端开发与数据存储技术已无法满足当今各种移动存储应用在平台独
随着计算机性能与网络传输能力的不断发展,人们在享受多媒体所带来的便利与乐趣的同时,正逐渐提升对多媒体数据的品质要求。超分辨率(Super-Resolution)技术正是针对图像、视
本文基于当前计算机系统的需求,选择一种新的计算思想,自律计算是让计算机拥有智能化的自我管理能力,具体主要包括自我配置,自我修复,自我优化,自我保护四个方面。自律计算能够解决
复杂网络作为近十年兴起的一门交叉性学科,受到来自不同领域研究工作者极大兴趣与广泛关注。对于社会学、计算机科学、生物学、神经学、经济学等诸多领域而言,借助复杂网络的理
E2xb算法是基于对攻击特征(模式字符串)进行检测(模式匹配)的入侵检测算法。它的原理是任何一个待检测的串(本论文称长度固定的待检测串为特征串),如果不包含某模式串的一部分