企业非结构化数据检索研究

来源 :信息技术 | 被引量 : 0次 | 上传用户:xujungang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化的高速发展,企业内部各业务系统中非结构化数据的数据量急剧膨胀,使得信息的搜索工作变得极为繁琐。建设该企业级非结构化数据检索平台,在Linux计算机集群上部署Hadoop开发框架以及Solr全文检索系统,将各业务系统中的非结构化数据进行集中式的存储、管理,并且提供统一的搜索服务。介绍了Solr的原理,并使用它搭建非结构化数据的中文搜索引擎,通过测试证明了该搜索引擎具有良好的搜索性能。通过检索平台,用户能够快速而高效地获取精确的搜索结果。
其他文献
云计算能够带来计算能力的巨大提升,但当前已有的云计算产品,不能直接用于期望利用现有计算机提升计算能力的内网中。提出了一种内网云计算模型,将内网现有计算机组织成云,提
本文将给出一类被你之为自共轭型的“绝对迹占优”实阵的特征值的一个有趣的不等式,并给出它在自动控制论中的应用。
对云计算技术进行概述,立足于应用现状与存在的问题两个角度,分析了中国医院信息化建设的现状。在当今互联网时代,云计算技术应用在医院信息化建设有许多机遇和挑战。对云计
本文以地方报为研究视角,以《萧山日报》为例,综合运用问卷调查、深度访谈等方法,对小记者活动经营进行个案研究,分析报社小记者活动经营的发展现状、成功经验,并提出发展对
新华社在国家高端智库建设中拟打造6个中心:依托参编部成立国情与战略研究中心;保留世界问题研究中心;依托中国经济信息社成立经济研究中心;依托新华网成立舆情研究中心;依托
目的总结合并糖尿病的急性胆囊炎外科治疗方法。方法对38例合并糖尿病急性胆囊炎进行回顾性分析。结果112例均行急诊手术,术后发生切口感染3例,肺部感染3例,尿路感染5例,无酮
目的探讨膀胱镜检加膀胱黏膜活检诊断泌尿系结核的价值。方法总结近12年来56例泌尿系结核患者的临床资料与膀胱镜检查加膀胱黏膜活检的结果,将之与同期进行的尿沉渣抗酸杆菌
<正>编者按媒体智库因长于调研,成果具有鲜明的实践导向,成为国家智库体系的重要组成部分。2015年11月,新华社入选首批25家国家高端智库建设试点单位,是其中唯一一家媒体单位
《人民政协报》依托政协平台和委员资源,就经济热点和改革难点话题组织"财经智库沙龙",以权威声音影响决策,走出了一条独特的媒体智库之路。
随着集成电路、专用芯片等科学技术的飞速发展,无线通讯技术也开始在汽车设备领域获得了广泛应用。目前,车载无线通讯技术不但是现代汽车安全的重要组成部分之一,而且大量应