【摘 要】
:
在日常生活中,人们经常需要检索历史经验知识作为解决当前问题的参考。而人类在认知过程中所积累的经验和方法,大都以非结构化的文本案例形式保存。可见,文本案例的检索已经
论文部分内容阅读
在日常生活中,人们经常需要检索历史经验知识作为解决当前问题的参考。而人类在认知过程中所积累的经验和方法,大都以非结构化的文本案例形式保存。可见,文本案例的检索已经成为了信息时代的需求。本文重点研究文本案例检索算法及其应用,完成的主要工作包括:1)文本案例的表示。根据文本案例本身的粒度特性,参照信息粒化的过程对文本案例进行粒化分析,应用粒度计算思想中从不同层次观察问题的策略,结合人类以句子为单位理解语言的特点,提出用句子向量空间模型对文本案例进行向量化的表示,将表示粒度从词提高到句子,并加入简单的语义信息。2)文本案例检索算法的研究。通过对案例检索中粒度原理的分析研究,将案例检索过程抽象为粒度计算的过程,提出基于句子向量空间模型的文本案例检索算法,经实验证明该算法可行并改善了检索效果。3)文本案例检索算法的改进。首先针对文本案例中信息冗余量过大从而影响检索效率和检索速度的问题,借鉴80/20法则提出关键句提取的思想,并应用该思想对检索算法进行改进,经实验证明改进算法在提高检索速度的同时改善了检索效果;其次在检索过程中加入领域知识,提出构建领域关键词库的思想,对文本案例检索算法进行再次改进,经实验证明改进后的算法提高了检索效率。4)检索速度的提高。由于案例知识库较为庞大,导致检索过程时间消耗大。本文基于MPI并行计算平台设计并实现了文本案例检索算法的并行化,提高了检索速度。5)文本案例知识检索系统的实现。在文本案例检索算法研究的基础上,给出系统的总体架构和工作流程,对主要功能模块的设计和实现进行详细说明,最终给出系统实现原型,验证了本文研究的模型和算法的可行性。
其他文献
随着Internet技术的兴起,B/S结构逐渐取代C/S结构成为网络应用开发所采用的的主要结构模式。B/S结构拥有众多优点,比如部署方便、升级维护简单,结构易于扩展等。但是随着客户端
并行处理技术近年来已成为计算机界研究的一个热点。采用并行处理技术来解决大数据量或时间复杂度高的问题不仅在计算机界,而且在其它科学领域都是首选的。而算法是并行处理技
在企业信息化日新月异的今天,SOA,即面向服务体系架构已经成为解决企业应用软件建设困境的必由之路。通过SOA应用、SOA企业架构和方法论、SOA基础设施这三个适合中国国情的切
基于内容的图像分类方法是计算机视觉领域中的难点和热点问题之一。目前几乎所有的图像分类方法都依赖于用图像底层特征间的距离来度量图像内容的语义相似度,实现对图像内容
上下文感知系统的广泛应用反映了其日益增长的市场需求和潜在的巨大经济效益。上下文感知系统通常是大型的、复杂的异构系统,开发这样的系统涉及到软件、硬件和网络的实现,设
本文以中国石油勘探生产信息门户为应用平台,介绍了Web服务的概念和核心技术,研究了基于不同平台下,设计、构建、部署、应用Web服务的方法。根据勘探生产门户信息共享的需要,
无线传感器网络是由部署在监测区域内大量的微型传感器节点组成,通过无线电通信形成的一个多跳自组织网络系统,能够感知、采集和处理被监测对象的信息,并发送给观测者,实现人
现代教育对考试形式、考试效果、考试统计、考试的即时性、学习效果的评价等要求越来越高。传统的纸质考试方式、人工教学评价方式越来越适应不了需要。随着专家系统、数据挖
Web技术日益成熟,基于Web的应用软件被应用到各个领域,尤其是Ajax技术的出现,使得Web应用变得更高效、更便捷、交互性更强。在大多数基于B/S模式的Web应用中,由服务器端主动
随着社交网络的迅速发展,微博在人们网络生活中的位置越发重要。相比于传统媒体,舆情事件消息在微博平台上的扩散速度更快、传播更广。微博为人们获取信息带来了便捷的同时,