后缀树聚类相关论文
随着计算机网络技术在全球范围内的迅速发展与普及,网络信息资源日趋丰富且内容复杂多样,其中既有大量进步、健康的信息,也不乏反......
模体发现问题,即寻找转录因子结合位点(TFBS),是生物信息学上研究的热门问题之一。由于模体蕴含着丰富的生命遗传特征信息,所以探究基......
随着互联网用户量的激增,使得网络中数据量飞速累积且数据格式也随之增多,搜索引擎成为了处于大数据背景下的网络用户获取所需信息......
讨论了利用分类测试集进行聚类量化评价的标准。在此基础上选择k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实......
提出一种基于后缀树的文本聚类算法以实现中文文本的多主题聚类。先介绍基于后缀树的英文多主题聚类的主要流程。再分析中、英文语......
经过几十年的发展,Internet已经成为世界上最大的资源库,其绝大部分信息都是以Web文本的形式存在。为了充分利用这些资源、使用户......
利用标准的分类测试集合进行聚类质量的量化评价,选择了k—Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比.实......
针对Web文档的结构及其特征,提出了一种新的加权后缀树聚类方法WSTC。首先,根据Web文档的HTML标签,把文档划分为具备不同重要性等......
今天,互联网已经成为一个大众化和交互式的信息发布媒介。Web作为一个巨大的、开放的、异构的和动态的信息容器,产生和容纳了巨大规......
地区官方微博中包含了大量相关当地的事件信息,聚合地区官方微博数据可以发掘当地的重要事件;结合地区微博数据地区别称、不同层级......
目前互联网领域主要的搜索引擎服务商如Google、百度、Yahoo等,为用户提供的都是横向的海量信息搜索。这些通用搜索引擎在满足信息......