个性化技术及其在数字图书馆中应用的研究

被引量 : 0次 | 上传用户:youzheng123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,国内外多个大规模图书数字化计划进展顺利,在大规模数字图书馆环境下的个性化技术研究已成为一个重要的研究方向。作者参与了“高等学校中英文图书数字化国际合作计划(CADAL)”的建设,主要负责研发CADAL百万册图书服务平台,为服务平台实现了图书推荐与搜索应用。本文工作围绕个性化技术研究及其在百万册图书上的应用而展开。针对推荐系统,研究了针对单维度评分以及多维度评分的协同过滤技术:但是在百万册图书服务平台服务过程中,发现读者很少为图书打分,导致基于评分的推荐系统不能够正常工作;为此研发了基于图书点击日志挖掘的图书实时推荐系统,并在个人空间中提供了基于自定义多媒体规则的个性化推荐系统。针对图书搜索,注重设计用户友好的人机交互界面。研究成果如下:(1)提出了针对单维度评分推荐系统的吸收随机行走模型:将单维度评分数据转换成为二部图,引入和每个用户或物品节点相连接的空节点,在增强二部图上运用高斯随机场进行建模,将top-N推荐问题建模成基于图的半监督分类问题,在考虑每个节点的度的情况下推导出一种有效的吸收随机行走模型。在两种真实数据集上的实验结果证明了该吸收随机行走模型的有效性。(2)提出了针对多维度评分推荐系统的两种概率隐含语义分析模型:扩展了著名的单维度评分概率隐含语义分析模型(pLSA),在保留pLSA引入的隐含变量的情况下,采用了两种不同的多元概率分布来建模每个用户的多维度评分。在Yahoo! Movies真实评分数据上的实验结果表明了两种多维度评分概率隐含语义分析模型在预测和推荐任务中的表现显著好于单维度pLSA以及其它对比方法。(3)研发了基于可伸缩紧凑浏览模式树的图书实时推荐系统:提出了红黑头节点树索引的紧凑浏览模式树,该数据结构使用前缀共享树来增量式处理新日志,使用红黑头节点树来显著地提高系统可伸缩性;提出了可伸缩紧凑浏览模式树的构建算法,以及基于该浏览模式树的分治式实时推荐算法。在CADAL服务平台的图书点击日志上的实验结果表明了该方法的有效性和高可伸缩性。(4)研发了百万册服务平台中的图书搜索服务和个性化空间:实现了交互界面友好的多资源库图书统一并行检索系统;研发了支持查询扩展和探索式浏览的图书章节检索系统;为个性化空间开发了基于自定义多媒体规则的个性化推荐系统,读者可以设置图书、图像和书法字三种多媒体规则,系统按照内容相似度以及从日志或用户反馈中挖掘出来的群体阅读倾向,主动推送合适的数字内容。
其他文献
妇炎平栓剂是由赤芍、延胡索、丹参、三棱、莪术、红藤、皂角刺、败酱草、川楝子共九味中药组成的中药复方制剂,具有清热利湿、抑菌消炎、活血化瘀、化滞通络的功效,主要用于
<正>(本刊讯)4月27日,中医心脑血管病研究新进展研讨会在北京召开。本次会议由环球中医药杂志社主办,康弘药业协办。研讨会由环球中医药杂志常务副总编辑、中华中医药学会内
群众概念是研究群众路线的理论起点,群众概念,是一个动态的、发展的概念;以人为本反映了对群众路线的新的发展和认识水平,它凸显了唯物史观和人类解放的时代主题、包含了发展
目的分析评价安全质量管理理念在医院药剂科管理中的应用方法及效果。方法在该院医院药剂科管理工作中实施安全质量管理理念,然后采取回顾性分析法,对实施安全质量管理理念前
根据金融计算机系统的发展趋势,结合邮政储蓄计算机系统业务、技术和管理现状,提出中国邮政储蓄计算机系统有必要进行网络系统的调整,实现省级数据大集中,并对数据大集中后系
<正>2018年7月7—8日,由中国会计学会会计信息化专业委员会主办,中央财经大学会计学院、中央财经大学管理会计研究与发展中心承办的中国会计学会第十七届全国会计信息化年会
利用CFD流体仿真软件FLUENT对不同口径、不同结构的膛口流场进行了数值模拟与仿真。主要内容包括:1)导出了流场的控制方程;建立了膛口流场的物理数学模型;选取合理的湍流模型
随着现代经济社会的不断进步,人们对城市中出现的交通拥堵问题越来越关注。交通信号自适应控制算法在交通控制中应用广泛,但当这些算法应用在实际路网时,由于交叉口之间控制
自我国实行村民自治制度以来,农村民主生活取得了突出的成绩,但同时也面临着不少的问题,需要村级民主监督发挥其应有的作用。村级民主监督能有效维护村民的基本权利,防止村干
党的十八大以来,党和国家高度重视培育和践行社会主义核心价值观,党的十八大报告明确将“自由”列为社会主义核心价值观的基本要素,并将其作为社会层面的价值统领。对社会主