基于P2P的隐含语义索引模型的研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:yuantian723
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P(peer-to-peer)是一种新兴的互联网应用技术,因其自身的可扩展性、容错性、自组织性、高效性、低成本性,而受到越来越多的关注。目前在大多数的P2P系统上的信息检索(informationretrieval,简称IR)方法依据关键词匹配。但这种检索方式,因一词多义和一义多词的存在而受到限制。 隐含语义索引模型(LatentSemanticIndexing,简称LSI)是一种将检索词和文件表示成矩阵的向量空间模型。它不再将词和文档之间的关系孤立。实验证明LSI[1]有更高的准确度和检索率。将P2P和LSI相结合,建立一种扩展的检索模式,有利于提高在网络中的查准率和查全率进而提高检索效率。 将LSI模型应用于P2P网络,必须要解决①P2P网络节点的动态性与LSI要求的共同的语义空间的矛盾。②网络中构建和维护隐含语义检索模型需要占用大量的系统资源。本文在混合结构的P2P网络平台上,提出了一种基于语义自适应的网络结构,在节点上构建隐含语义索引模型并引入移动Agent,以此提高检索效率和网络的可扩展性,同时在检索策略上做了进一步的研究。 本工作得到了上海市科委发展基金项目“基于对等计算(P2P)技术的虚拟研究平台”的支持。本文主要对基于自适应语义的P2P网络的结构及相应的检索策略进行了有益的探索和实践,具体工作如下: 1.分析在P2P网络中应用语义检索技术的现状。 2.构建一种基于语义自适应的P2P网络。 3.在信息检索中应用LSI技术和移动Agent技术。 4.提出一种基于语义自适应网络的改进的检索策略,并与现有的策略进行仿真模拟比较。 5.实现了一个基于P2P网络的LSI信息检索模型系统。
其他文献
无线网络技术和流媒体应用技术是现今最流行、发展最迅猛的两项因特网技术,它们的出现为信息的传播与交流带来革命性的变化,也对人们的生活产生了深远的影响。随着3G时代的即
语言是人类所特有的也是最重要的交际手段,随着科技的发展,在现代社会,电话逐渐成为人们日常交流和感情沟通的重要手段,电话语音的识别研究也就相应变得越发重要起来。  电话语
在网络应用不断发展的今天,网络安全问题也日益突出,越来越多的安全技术被应用到网络安全领域。而大部分安全措施都属于被动防御,缺乏积极的保护措施。 入侵检测是网络安全体
网格是在计算机技术和网络技术发展到一定阶段提出的一种建立新型计算平台的计算技术,它要整合广域网中分布的,动态的,异构的资源,实现充分共享和各种资源之间广泛的协同工作
图像拼接是一个日益流行的研究领域,它已经成为照相绘图学、计算机视觉、图像处理和计算机图形学研究中的热点。图像拼接解决的问题一般是通过对齐一系列空间重叠的图像,构造
随着现代企业制度的建立以及社会经济的高速发展,企业人力资源已成为左右企业生存发展的重要因素,加强人力资源的有效管理和运作已成为企业提高竞争力的重要手段。 作者在研究国内外人力资源管理系统发展和Web技术的基础上,提出了一个实用的人力资源管理系统结构以及绩效考核算法,采用Delphi 7开发了基于Web的人力资源管理系统(HRMS)。系统包括九个模块:人事信息管理、考勤管理、培训管理、休假管理
智能交通系统(ITS)已经成为21世纪交通运输体系的发展趋势,其实质是对交通信息的分析、共享和综合利用。数据挖掘,简单地说,就是从大量数据中提取或“挖掘”知识。分类分析是数
本文在深入研究垃圾邮件的特点及其产生的根源、现有反垃圾邮件技术的优劣、中文分词技术、文本分类技术的基础上,将目前最优秀的中文分词技术与贝叶斯方法相结合,提出了针对中
随着攻击手段的复杂化和多样化,传统的入侵检测方法己不能满足安全需求,智能入侵检测已逐渐成为入侵检测乃至整个网络安全领域的研究重点之一。本文采用神经网络模型来实现系
随着网络技术的快速发展,依托网络,发挥网络信息资源丰富和不受时空限制的优势,实现网络教学,已经日趋普及。但是,由于学员个性千差万别,若使用划一的、模式化的教学形式,将