基于社会化标注的个性化检索方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:liucheng333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着搜索引擎的发展,用户对于信息检索的需求也日益提高。为了更好的满足用户对于查询的需求,个性化检索技术应运而生。其主要是用于解决在信息检索时如何根据用户兴趣返回对应的搜索结果的问题。在这一过程中,越来越多的资源被引入其中,用来构建用户的兴趣。随着Web2.0的发展,社会化标注系统得到了很好的普及,而社会化标注作为用户直接给出的资源,对应个性化检索有着很大的意义。目前,基于社会化标注的个性化检索的有效性已经得到了很好的验证,但依然存在一定的上升空间。本文的主要目的就是在于如何能够使用社会化标注更好地提升个性化检索的效果。在使用社会化标注进行个性化检索时,要注意标签只是用户兴趣的一个方面,不能完全表示。同时不同用户给出的标签在质量上也有区别,这种质量也会对检索的准确性产生影响,同时标注的稀疏性问题也会给检索带来一定的困难。基于上述分析,本文的主要贡献包括以下两方面:首先,仅使用社会化标注时,本文提出了基于用户相似网络的个性化检索方法。用类比VSM模型的方法计算标签对于用户的权重,并引入了用户在文档上的相似性这一概念,使用户相似度计算更加准确。同时将用户之间的相似关系看作网络关系,参考网络中节点互相影响的方法在降低检索复杂度的同时解决标注稀疏的问题,从而使检索结果对于用户而言更加可靠。实验证明该方法可以在减小消耗的同时一定程度提升检索质量。其次,为了更好地构筑用户的兴趣,本文提出了一种融合用户相似度和用户质量的个性化检索方法,该方法在使用社会化标注的基础上引入了网页分类信息共同计算用户之间的相似度,并且通过两种资源结合改进的Social PageRank算法对于用户的质量也进行判断,从而在扩展时提高质量,进而提升检索效果。本文实验证明该方法对于个性化检索的效果有较大提升。
其他文献
随着计算机和网络技术的发展,大规模数据库在各种信息系统中的应用日益广泛,数据库的设计与查询成为信息系统设计中的关键技术。无环数据库具有许多优良的特性,不存在许多在
作为增加虚拟场景真实感的关键技术——光照渲染技术,在三维游戏、动画影视、三维地理信息系统等方面都有广泛的应用。然而,针对基于球面谐波函数(spherical harmonics,简称S
随着社会的发展,作为交流沟通重要的辅助手段,交通系统成为了人们日常生活不可或缺的一部分,但由于汽车保有量的激增,交通领域拥堵等问题已经严重阻碍了社会的发展。传统的交通控
随着网络和网络攻击技术的不断发展,传统的安全防御技术已经不能满足网络安全的需要。入侵检测作为一种主动防御技术,不但能检测到来自外部网络的攻击,而且还能检测来自内部
学位
本文以国家自然科学基金项目和北京市教育委员会科技发展计划重点项目为科研任务,对基于数据挖掘的旅游突发事件预警进行了研究。对旅游突发事件信息的分类算法进行了研究,改进
网络信息时代的到来,多媒体技术和微电子技术的发展使得许多传统媒体内容向数字化转变。由于音频、视频、图像等作品都能以数字形式获得,制作其完美的拷贝和恶意的篡改变得十分
本文使用展讯公司的SC8800平台设备,来实现远程控制系统中的图像采集系统。 在SC8800微处理器平台上,使用Threadx作为系统地操作系统,完成了视频数据的采集、压缩、存储和控
网格计算是下一代分布式计算技术,它为解决大规模的、复杂的计算提供了平台。要实现高效的网格计算需要解决许多问题,任务调度就是其中之一。网格任务调度的主要目标是在任务与
随着网络信息技术的迅猛发展,医疗数据信息化成为实现数字化医院的趋势,但是现存的医疗设备依然停留在单个或少数设备单独工作的模式下,这不但造成设备成本高昂,计算单元浪费,并且因为使用协议不统一,功能分散,很难实现数据的互通与融合,这样医疗服务的信息化优势很难凸显出来。本文重点研究了嵌入式医疗数据的传输技术,给出了一种医疗数据传输平台的新解决方案。系统采用C/S架构,由三部分构成:患者数据采集,数据集中