论文部分内容阅读
随着计算机科学与技术的发展,人们越来越认识到软件的价值。在信息爆炸的今天,人们迫切需要一种方法从大量的数据信息中提取并找到有用的信息,数据挖掘就是在这种情况下诞生的。近十年,数据挖掘的研究工作取得了很大的进展,各种数据挖掘软件的应用极大地推动了人们掌握、处理信息的能力,并为人们带来了很好的经济效益。 与传统的统计、总结方法相比,数据挖掘技术涉及到多个学科,汇集了人工智能、模式识别、数据库、机器学习以及管理信息系统等学科的成果。数据挖掘是一个新兴的边缘学科,其应用领域非常广泛,并具有良好的应用前景。 本文从基于数据库的知识发现开始,较系统全面地介绍了KDD、数据挖掘的基本概念,并研究了数据挖掘所采用的技术方法和应用领域;在现有研究工作的基础上,提出用连续量代替离散量来表示客体的思想,同时采用积分面积来表示两个客体之间的距离,并对客体进行分类。利用上述方法对学生的数据进行挖掘,得到了一些有用的结论,从而指导学校的教学工作。本文取得的主要成果有: 1.提出一种新的用连续量代替离散量来表示客体的方法; 2.基于积分原理,提出一种新的距离定义,依此距离定义,构造 了一种数据分类算法; 3.在分类的基础上,建立了各类数据之间的关联规则。