论文部分内容阅读
随着信息量的增长,数据挖掘技术在越来越多的领域广泛应用。数据挖掘是通过对大量数据进行处理,析取、识别和发现可用知识的过程,从而帮助用户了解已有的信息,并预测未来的信息。
现代的图书馆,不仅包含有图书和期刊一类的传统纸质资源,还拥有了大量的电子资源。综合使用这些资源,是现在每一位读者应该具备的一种能力。目前的图书馆,每天都会产生大量数据,使用简单的统计方法只能发现一些表面的问题,无法挖掘出数据之间的联系。因此,需要使用数据挖掘方法,发现图书馆各种资源之间存在的联系,指导图书馆更加合理配置各种资源,提高资源的利用率。
本文主要研究通过使用数据挖掘中关联规则的方法,分析出图书馆广大读者对于图书馆各种资源的使用情况(包括图书资源、期刊资源、电子资源),再将这些知识应用于图书馆日常管理,使得图书馆在宣传各种信息资源的时候有的放矢,从而提高图书馆资源的使用率。
本文首先介绍了数据挖掘的基本理论;其次,阐述了关联规则的概念及常用算法,并将Apriori算法与FP-growth算法这两种经典关联规则算法进行了比较;再次,详细说明了数据预处理的过程;最后,使用关联规则中的FP-growth算法分析出图书馆使用中存在的关联规则,从而得出如何提高图书馆资源使用率的结论。这些分析必将对图书馆今后的管理与资源宣传有着重要的指导意义。