分布式知识搜索系统的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:gbe3919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网中蕴含着大量的有价值信息,而搜索引擎是目前人们从互联网上检索信息的重要工具。传统的搜索引擎仅依靠关键字匹配为用户寻找相关的网页,并根据一定的算法进行排名呈献给用户,并没有参考网页的语义信息。随着互联网技术的发展和人们精确搜索需求的增加,传统的搜索引擎已经不能够很好地适应这一需求的变化。为了解决传统搜索引擎存在的不足,知识搜索应运而生。知识搜索会分析用户的查询意图,并将相关的知识返回给用户,大大提高了搜索结果的准确程度和相关程度。由于自然语言处理的高耗时性并顾及到知识库增长带来的存储问题以及安全性,本文将知识搜索与分布式框架相结合,实现了一个包含工作流框架、分布式爬虫和分布式知识抽取模块的可灵活配置流程的分布式知识搜索系统,并对单机系统和分布式系统的效率进行了对比。在由三台机器组成的实验性分布式系统上进行的对比实验说明分布式知识抽取系统的效率比单机系统提高了近一倍,并且可以随着分布式集群的扩展继续提高。同时,分布式系统也能提供更好的安全性。
其他文献
随着社会信息化的发展以及安全保障的需求,实时视频监控技术得到了快速的发展和改进。在学校、城市交通、银行、医院等生活中的各个领域,实时视频监控技术都发挥出了重要作用
在互联网技术飞速发展的今天,微信、米聊等互联网应用给传统电信通信带来巨大的冲击;与此同时,互联网用户也渴望享受更加可靠、稳定、方便的电话网服务。为了很好的解决这个问
随着数据库技术日渐成熟,互联网堆积了大量公开的信息网络数据,如何利用这些数据进行分析,并从数据中提取出对于机构决策分析有用的信息已经成为了各机构决策管理以及决策分
在现今高度复杂的分布式计算环境中,网络应用服务系统往往被细化为许多服务子系统从而形成多层次的服务结构。这种结构极易拓展并且通用性很强,允许通过网络在不同机器上传递