论文部分内容阅读
目前多数高校的在校生人数都已达上万甚至十几万的规模,教师人数也在千人以上。高校运行着的各种系统和各类数据库,如学籍管理、成绩管理等,己经积累了大量的数据。管理人员只能通过简单的统计或排序等功能获得表面的信息,由于缺乏信息意识和技术,隐藏在这些大量数据中的信息一直没有得到有效利用。如何对这些数据进行重新利用,将现有的管理数据转化为可供使用的知识,提高学校管理决策性,提高管理水平和办学质量,是很多高校正在考虑的问题。通过数据挖掘技术,在一定程度上能够解决这些问题,使信息系统的功能得到最大程度的利用。数据挖掘是从数据中析取、识别和发现潜在正确和有用、前所未知的、最终可理解的知识(规则或模型)的过程。数据挖掘技术要在已有数据中识别数据的模式,以帮助用户理解现有的信息,并在已有信息的基础上,对未来状况做出预测。关联规则挖掘是数据挖掘领域的重要研究方向。关联规则反映的是数据之间一种内在的关联关系。发现数据间的这种内在联系,有利于决策者利用这些规则做出正确和合理的决策。关联规则的算法可依据需不需要产生侯选项集的做法分为两类,以FP树法与类Apriori方法为代表。此两者最主要的差异在于,FP树法并不产生侯选项集,它将数据库压缩在FP树结构中,避免多次的高成本的数据库扫描,后者是需要产生侯选项集的方法。本文从数据挖掘技术的研究入手,深入研究了关联规则挖掘,并在此基础上对经典的关联规则挖掘算法Apriori算法进行分析,指出其不足之处,提出了两个新的改进算法。此外还结合常州工学院目前招生管理的具体情况出发,将关联规则技术运用到高校招生管理中,通过对招生数据进行数据挖掘,得到了许多有价值的信息,这些知识让校方更能有的放矢制定招生计划,对学生就业情况的掌握以及课程安排等方面无疑具有重要的指导意义。