两种重复提取算法的研究比较

来源 :网络安全技术与应用 | 被引量 : 0次 | 上传用户：buyaowenwo123456

【摘要】

：

在利用计算机处理文本信息时,为了能发现大文本信息中的重复词句,本文介绍两种用来发现重复词句的算法——基于后缀树的方法和基于倒排索引的方法。第一种ST算法使用树型数据结构,每个节点表示一个字并且根节点为空。第二种算法应用倒排索引,以及哈希表实现方法(HT)。对同一样本运行仿真后,在时间和空间复杂度上对实验结果进行比较。得出结论,尽管ST算法在考虑到时间成本时要更优,但在空间复杂度方面倒排索引方法更胜

【作者】

：

殷波蒋华刘新平

【机构】

：

桂林电子科技大学计算机学院,广西,541004

【出处】

：

网络安全技术与应用

【发表日期】

：

2009年01期

【关键词】

：

重复词句重复序列后缀树算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

中国锻造行业未来发展方略

期刊

文件分割机

期刊

液压机本体CAD的现状及发展

针对国内液压机设计的落后现状,开发了一套以专家系统为支撑、以现代设计理论和方法为手段、以AutoCAD为绘图平台的液压机本体设计CAD系统YYJCAD1.0.YYJCAD1 .0包括本体设计

期刊

专家系统离散优化参数化CAD

人体七个不疼的癌变症状

我们往往以为，身体有了病痛，说明身体的某个地方出现了问题，但实际上，有很多病是没有痛感的，我们更需要加强平常的体检，选择健康的生活方式来杜绝这些无痛疾病的侵扰。以下这7个症状发生时无疼痛感，千万要警惕，因为这就是癌症早期的症状!　　　　无疼血尿　　　　尿血而无腹疼症状是肾癌、膀胱癌的早期症状。如伴有腹疼的尿血则可能是泌尿系统结石。因此，同样是血尿，良恶性疾病的区别主要看有无腹疼。　　　　无疼乳房包

期刊

人体癌变健康的生活方式症状疼痛感身体无痛问题体检侵扰疾病癌症

美国伟康国际公司眼科产品简介

期刊

美国眼科

CD36 mRNA在卵巢颗粒细胞的表达调节及与多囊卵巢综合征的相关性

目的探讨CD36mRNA在多囊卵巢综合征(PCOS)患者卵巢颗粒细胞的表达，以及不同浓度的睾酮、胰岛素及罗格列酮对正常卵巢颗粒细胞CD36mRNA的表达调节。方法分别提取5例PCOS患者和5名健康人卵巢颗粒细胞，应用实时荧光定量RT-PCR方法检测CD36mRNA的表达；提取25名健康人卵巢颗粒细胞进行体外培养48 h后，分别用含不同浓度的睾酮、胰岛素及PPARγ的激动剂(罗格列酮)的培养基培养颗

期刊

多囊卵巢综合征睾酮胰岛素

基于有限元模拟的筒形件错距旋压智能参数优化系统研究

以有限元模拟分析为基础 ,建立了筒形件错距旋压智能参数优化系统。实现了对错距旋压工艺的三维仿真 ,并结合人工智能技术 ,实现了对错距旋压工艺参数的优化 Based on the f

期刊

筒形件旋压神经网络参数优化

男人30岁后8项检查不能少

不少男性朋友都定期在进行健康体检，然而检查内容是否科学？男人30岁后，下面8项检查你做到没？　　　　※ 胆固醇　　　　胆固醇偏高没有明显症状，但必须对此高度重视。如果有以下情况之一，检查应提前至20岁：吸烟、肥胖，患有心脏病、糖尿病或高血压，直系亲属中有人分别在50岁和60岁之前发生过心脏病。医生建议，30岁以上男性应每年查一次胆固醇。　　　　※ 血压　　　　头晕、恶心以及早起头痛都是血压偏高的

期刊

男人胆固醇心脏病检查直系亲属男性健康体检糖尿病高血压症状医生吸烟内容科学肥胖

极爪零件的温锻成形及其三维有限元模拟

分析了极爪零件的成形工艺 ,建立了该零件温锻精密成形的三维塑性有限元模型 ,模拟了其温锻成形关键工步 ,得出变形过程中材料的流动情况、变形载荷及模具的受力分布 ,模拟结

期刊

温锻精密成形三维有限元模拟极爪零件

七个妙招让男人“硬”起来

外壳坚硬、职场风光的男人，内心和身体却可能比女人更脆弱。数据显示男性的平均寿命比女性寿命短5至10年，精子的活力在过去50年里下降了50%。男人正在沦为健康的弱势群体，作为他的另一半，用七个妙招打造属于你的硬汉吧。　　　　　　【男人需要加锌的健康零食】　　　　零食不是女人的专利，更不是不健康的代名词。男人适当吃点健康零食，值得提倡，比如：补锌的坚果如白瓜子、花生仁、南瓜籽、大杏仁等，它们所富含的锌

期刊

寿命短寿命比职场外壳数据身体女性女人男性男人精子活力

两种重复提取算法的研究比较

与本文相关的学术论文