数字图书馆数据挖掘研究

来源 :武汉大学 | 被引量 : 9次 | 上传用户:precursor1231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘,这种全新的技术,是为解决当前“信息丰富而知识贫乏”这一问题而出现的。目前,它已经在银行业、零售业、工程技术和医学等领域得到成功的应用和空前的发展,在这些领域成功的应用鼓励人们将数据挖掘技术应用到更多,更广泛的领域中去。数字图书馆是综合运用多方面高新技术支持的数字信息资源管理系统,从它产生起就得到广泛的关注和蓬勃的发展,目前,网络上数字图书馆越来越多,数字图书馆的数据挖掘和知识发现研究具有较大的实用价值。 本文共分五个部分。 第一部分,数据挖掘概述。论述了数据挖掘的概念,数据挖掘的研究历史及现状,数据挖掘在数字图书馆中的应用,按照数据挖掘处理对象的不同,将数字图书馆数据挖掘分为三大类:结构挖掘、内容挖掘和用户使用记录挖掘。 第二部分,数字图书馆结构挖掘。分析了数字图书馆结构的组成部分:节点和链,数字图书馆结构挖掘的含义和意义,提出基于结构挖掘的数字图书馆网站内链接、网站外链接的结构优化方案和超文本链接的动态优化方案。 第三部分,数字图书馆内容挖掘。首先概述了数字图书馆内容挖掘的主要步骤,挖掘系统的结构,并具体分析了几个实用数据挖掘系统。然后深入分析了数字图书馆文本数据、多媒体数据和分布式数据挖掘的特点、内容、方式、方法、步骤等,同时分析了相应的数据挖掘系统。 第四部分,数字图书馆用户使用记录挖掘。论述了使用记录挖掘的作用,阐述了使用记录挖掘的数据源和使用记录挖掘的步骤。 第五部分,案例分析。主要对关联规则挖掘和使用记录挖掘进行案例分析。 本文采用如下方法进行研究:①文献研究法:通过广泛收集国内外各种有关此课题的研究,了解相关研究的发展动态。②理论研究和案例分析法相结合,结合理论研究内容,选择一些典型的个案进行深入的分析,如对关联规则挖掘和用户使用记录挖掘等的实例分析。此外,还采用综合、归纳等研究方法。 本文在选题上,是一个全新的研究领域,目前很少有人在这方面进行全面、深入、系统的研究。本文较为系统地论述了数据挖掘技术应用于数字图书馆的有关问题;从理论上探讨了数据挖掘技术在数字图书馆结构、内容、用户使用记录三方面的应用,对三方面的挖掘方法、步骤、策略和技巧进行了探索性研究。由于各方面条件的限制,本文只做了初步的研究,许多问题有待日后进一步深化。文中难免多有欠缺,恳请各位专家和老师指正。
其他文献
明永乐迁都后至万历时期,金陵书法发展经历三个发展阶段:"台阁余绪、波澜不惊"的沉寂期(永乐十九年至成化前期,1421-1465);"由韵到意,韵意交织"的复苏与活跃期(成化、弘治、
预应力锚索格构梁复合结构是近年来在边坡治理中推广的新型结构措施。本文通过工程实例介绍了预应力锚索格构梁复合结构的设计、试验、施工要点,供同类工程参考。
G/T值是卫星地面接收系统的一项重要指标,常规测试方法耗时、费力、计算量大。通过工程实践详细论述利用射电星法测量地面大型天线系统的G/T值的原理及计算方法,论证G/T值自
随着知识经济时代的到来和全球经济一体化进程的深入,企业面临着多变的生存环境和激烈的竞争。建立一套科学的企业绩效评价体系,及时、准确地评价企业战略目标的执行情况,对于企
有关运动性疲劳产生的的机理及对它如何进行有效预防和消除的研究,一直是令运动医学工作者瞩目的前沿课题。运动性疲劳时出现的机体变化较为复杂,涉及物质代谢、神经、内分泌
本文系统的介绍与分析了搜索引擎的工作原理和搜索引擎的相关性排序理论,从信息检索系统理论的角度剖析了搜索引擎的工作流程、组成结构,对搜索引擎的收集器、索引器、检索器进
提出了使用FIR匹配滤波器的多进制扩频检测方法,阐明了FIR匹配滤波器输出相关值与传统多路相关器输出相关值的一致性和理论依据,给出了多进制扩频检测的2种比特软值输出计算
随着经济的快速发展及城市人口数量的急剧增长,城市用水量日益增加。为了满足不断增长的城市生产、生活用水,城市水厂数量、规模也逐渐扩大。 不断增加的水厂数量、不断扩大
进入21世纪以来,随着社会生产力水平的提高,经济发展变化节奏的日益加快,经济信息的数量呈现急剧增长的趋势,经济信息的结构也变得日益复杂,这一切使得经济领域中的分析、预测与决
微管道换热器以其换热性能卓越、结构紧凑等优点成为小体积高功率电子器件首选的新型散热方式。本文结合硅加工的多路感应耦合等离子体蚀刻工艺,设计并加工了硅制微管道换热器