图书馆资源使用数据的关联规则挖掘设计与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:lcm2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息量的增长,数据挖掘技术在越来越多的领域广泛应用。数据挖掘是通过对大量数据进行处理,析取、识别和发现可用知识的过程,从而帮助用户了解已有的信息,并预测未来的信息。   现代的图书馆,不仅包含有图书和期刊一类的传统纸质资源,还拥有了大量的电子资源。综合使用这些资源,是现在每一位读者应该具备的一种能力。目前的图书馆,每天都会产生大量数据,使用简单的统计方法只能发现一些表面的问题,无法挖掘出数据之间的联系。因此,需要使用数据挖掘方法,发现图书馆各种资源之间存在的联系,指导图书馆更加合理配置各种资源,提高资源的利用率。   本文主要研究通过使用数据挖掘中关联规则的方法,分析出图书馆广大读者对于图书馆各种资源的使用情况(包括图书资源、期刊资源、电子资源),再将这些知识应用于图书馆日常管理,使得图书馆在宣传各种信息资源的时候有的放矢,从而提高图书馆资源的使用率。   本文首先介绍了数据挖掘的基本理论;其次,阐述了关联规则的概念及常用算法,并将Apriori算法与FP-growth算法这两种经典关联规则算法进行了比较;再次,详细说明了数据预处理的过程;最后,使用关联规则中的FP-growth算法分析出图书馆使用中存在的关联规则,从而得出如何提高图书馆资源使用率的结论。这些分析必将对图书馆今后的管理与资源宣传有着重要的指导意义。
其他文献
为克服传统信息系统存在的封闭、功能单一、难以控制及管理等缺点,本文采用将虚拟组织技术应用于信息系统,通过虚拟组织建立企业信息系统间的联盟,实现企业自身效益的最大化
客户关系管理CRM(Customer Relationship Management)综合了信息技术、网络技术、数据库技术,为企业搭建一个客户信息采集、统计、分析、利用的平台[1]。能够为企业的营销、市
Web Service是一种不依赖于编程语言、计算平台和网络协议的开发标准,它可以通过高级的编程抽象,为应用开发者屏蔽分布复杂性。负载均衡的主要功能是合理透明地在服务器之间
随着近代社会的飞速发展,全球范围内各种金融风暴、危机不断。这种现象引起了各国政府和经济学家对金融风险问题的普遍关注。为此经济学家提出了各种预警模型,然而这些模型都
Ad-Hoc网又称多跳网或自组织网,由于Ad-Hoc网络没有绝对的控制中心、动态拓扑结构变化及节点资源受限等缺点,Ad-Hoc网络的安全问题已成为当前的研究热点。签密能同时完成数字签
网格计算自从上一世纪九十年代中期出现以来,逐渐被认为是支持广域并行和分布式计算的下一代主流计算平台,可以实现计算、信息、数据、存储、知识等资源的全面共享。网格工作
近年来,随着CAD/CAM技术在企业的应用日益广泛,企业已具备了先进的产品设计与开发手段,工作效率得到显著提高。与此同时,企业积累了大量的图纸、文档等技术资料,且这些电子化
车辆识别技术是智能交通领域的关键技术之一,车标识别技术是车辆识别技术新的研究方向,是对基于车牌和车型识别的车辆识别技术的重要补充和发展,具有十分重要的理论意义和应
自从20世纪80年代以来,群体智能(Swarm Intelligence)作为一个新兴领域,引起了许多研究人员的关注,已经成为人工智能以及社会、经济、生物等交叉学科的热点和前沿领域。人工神经