论文部分内容阅读
随着信息技术和网络技术的发展,图书馆的数字资源越来越丰富和完善,对于数字图书馆来说,不仅仅为读者提供信息资源,还需要对于不同的用户提供个性化的信息服务,进而提升数字图书馆的服务质量和水平,提高资源信息的利用率。在此背景下,本文提出了一种基于Web的数字图书馆个性化服务机制,并从实现算法的角度,对系统进行了研究。本文在分析当前提供个性化服务的内涵、特征和方式的基础上,利用数据挖掘领域的Web挖掘技术的方案,解决了图书馆个性化信息服务不足的问题。首先研究了两种基于Web的个性化服务挖掘技术关联规则发现技术和聚类方法,并对各算法的性能、优缺点进行了分析,针对k-means聚类算法中必须先指定聚类数目k值的不足,提出了先层次聚类再划分聚类的两种聚类相结合的算法。接着从系统功能的实现过程出发,提出了在线和离线部分分离设计、融合实现个性化推荐的设计思想。系统首先从数据准备、用户兴趣模型的建立,其次到在线推荐引擎产生结果推荐集的各个模块的功能设计,然后再对离线部分详细的设计,最后提出了用户兴趣模型库,通过对用户Web浏览内容和用户浏览行为的分析,将二者的分析结果相结合形成用户兴趣描述文件,再与信息资源库相关联生成用户兴趣模型库的设计思想,使用户兴趣模型以二层结构的基于向量空间模型的形式表示。本文还对用户兴趣模型库的更新算法进行了分析和探讨。最后个性化推荐系统的实现,包括了三个主要模块数据预处理模块,频繁访问模式发现模块,在线推荐模块的代码及实现,对系统进行了测试,结果分析表明系统很好地实现了用户的需求,其整体性能实现了系统预期的设计目标。本文针对当今数字图书馆个性化信息服务系统中存在的问题,结合图书馆数字化建设提出了数据挖掘技术,设计挖掘出用户的兴趣模式的个性化信息服务系统的实现方案,其适应了时代发展的需要,满足了用户当前的需求,更好地提高图书馆资源利用率。