论文部分内容阅读
数据挖掘在二十世纪的后期开始由于世界经济的海量的数据资源和对于数据的需求而得到了迅速的发展,需要将现存的各种的数据资源通过深入的分析和挖掘转换成为人们所需要的信息和资源,在数据挖掘当中,随着其的发展其中一个非常重要的应用就是关联规则算法的数据挖掘,并且人们对其不断的改进和应用满足人们的数据需求。本文通过研究数据挖掘的相关的算法和改进,分析高校中的学生就业的相关的数据,挖掘学生就业数据中的关联关系从而为高校学生就业工作服务。论文首先分析了数据挖掘技术,介绍了二个关联规则算法,并且重点研究了Apriori算法的实现过程。然后分析了传统的Apriori算法在高校学生就业数据分析和应用中的不足,特别是计算候选频繁项集上时间成本耗费过大,因此对传统Apriori算法分别在算法的属性选择过程进行数据的预处理,使得算法可读性方面得到明显的改善,通过新旧算法的比较验证了算法在时间效率方面得到了进一步的提高。最后将改进后的Apriori算法应用到学生就业系统中,利用算法分析不同专业不同学年的学生影响就业的因素,证明Apriori算法在解决高校的学生就业的问题上是可行和有效的。通过对Apriori算法进行改进及在高校就业数据中进行应用,分析学生就业与学生的专业、家庭等关系,形成针对高校的就业分析规则,为高校就业部门服务,具有极大的应用价值。