基于本体和互信息的查询语义扩展模型的研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:wdtt111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的发展,人类已经步入信息时代。信息发布的自由化和信息提供的简单化,促进了WWW的繁荣。然而随着网上数字化信息量的日益庞大,WWW上大量分布的无结构和半结构化数据日益加剧了信息检索的困难度。因此如何快速准确的检索相关信息已经成为当今信息领域的研究热点。由于信息发布的自由化,人们将信息发布到网上时,针对同一领域的知识点,不同的信息发布者所使用的特征词或关键字可能不径相同;再加上用户在搜索信息时,大多数人仅仅是输入一个关键字进行搜索;这两种情况的存在又增加了在网上搜索到用户所需信息的难度。在这种情况下,本文的研究以如何能使用户通过搜索引擎得到更好的可用信息为目的,构建了基于本体和互信息的查询语义扩展模型(QSE_OMI)。本文的研究工作主要包括以下几个方面:1、研究如何将互信息与查询语义扩展相结合。互信息是用来表示两个单词之间关联程度大小的量度;同时,查询语义扩展是将用户输入的查询关键字进行领域相关的扩展。本文在分析和讨论了这两种理论之后,给出了如何将这两者结合在一起,并创建了查询语义扩展子模型,对其进行了讨论和研究;2、本文还对本体和互信息的优势分别进行了阐述,并利用其各自的特点及优势,提出将二者结合在一起,形成优势互补,使查询语义扩展能深入到语义理解层次,能更进一步地抑制盲目扩展而带来的信息冗余;3、在上述工作的基础上,论文设计并实现了实验系统QSE_OMI。实验系统运行情况及实验结果表明,基于本体和互信息的查询语义个性化扩展能较好的对用户查询问句关键字进行领域相关的扩展,并在检索结果的查全率和查准率上有一定的提高。本文的研究对QE的相关理论有一定的促进作用,同时我们所研究的QSE_OMI可在支持用户个性化检索的同时,进行语义层面上的扩展,这对查询扩展优化这方面的研究有一定的推动作用。
其他文献
随着计算机图形学的飞速发展,以非真实感为目标的图形学越来越受到人们的重视。非真实感绘制是计算机图形学中一个崭新而富有活力的分支。线条画作为一种有效表示形状抽象信
社会的需求和技术的进步促进了网络带宽和传输速度的飞速发展。当网络进入Gbit或者更高速度传输时,提高TCP/IP协议性能的主要任务已经从网络转移到主机CPU上,传统的基于软件进
随着图像处理技术的快速发展,近年来视觉测量技术的研究也取得了较大进步,并得到了广泛应用,例如工业零件检测、车辆测距以及机器人视觉。在现代体育中利用该技术可以实现体
随着软件业的不断发展,与软件质量息息相关的软件测试环节也越来越受到软件用户以及软件开发者们的重视。现在所谓的软件测试不仅仅是在开发结束以后,对代码的功能性测试;伴随着
三维打印是一种增材制造技术已经在医学、电子、机械、航空等领域得到了广泛应用,同时桌面式三维打印机由于其成本低,体积小等优势也在办公,家庭等领域得到应用。但目前已有
中间件通过提供简单、一致、集成的分布式开发环境,简化了分布式应用的开发和管理。中间件使得应用程序能够跨平台和异构网络运行。其中,主流的中间件有CORBA和DCOM。CORBA具
分布式协同设计是计算机支持大型工程设计的有效方法。由于飞机协同设计等大型项目的设计过程是多次反复迭代的过程,因此对分布式协同设计而言,可靠、有效的版本控制显得尤为重
蚁群优化(ACO)算法在国内外已经取得了很多的研究成果,也有很多应用证实了其在解决组合优化问题中的优越性,本文研究将ACO算法应用于大学课程时间表问题。本文分析了大学课程
电信宽带用户行为监控分析系统是中国电信集团运行维护支撑系统的关键子系统。本文主要是对项目实施过程中涉及的电信规范、需求模型、数据库方案、系统接口展开讨论,以获得
科学技术的飞速发展使信息社会产生日新月异的变化,多媒体技术成为21世纪计算机技术发展的一个重大热点。人们通过语言、音乐、文字、图形、图像、电视等多种媒体进行信息的