基于后缀数组技术识别网络热点话题的研究

来源 :信息与电脑(理论版) | 被引量 : 0次 | 上传用户:gyqg1q
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了后缀数组技术及相关的基本概念,以及配合后缀组的最长公共前缀数组的构造方法,利用倍增算法构建了后缀数组,基于后缀数组技术,实现了多个短文本串中LCS的提取,进而识别网络热点话题,然后通过后缀数组来辅助监测短文本聚类后各类中的热点话题。 This paper introduces the technology of suffix array and related basic concepts, as well as constructs the longest common prefix array with suffix group, constructs the suffix array by multiplication algorithm, and realizes the LCS extraction of multiple short text strings based on the suffix array technology , And then identify the network hot topic, and then through the suffix array to help monitor the short text clustering hot topics in all categories.
其他文献