一种基于链接聚类的查询扩展算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:lingshao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
潜在语义分析(LSA)是一种用于自动实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从其中挖掘出词语之间的潜在联系.LSA有效地解决了一义多词的问题,但是,由于LSA在大矩阵的计算效率和存储上的不足,这限制了LSA在大规模数据集上的应用.另一方面,在关系数据库中,数据对象通过多种类型的链接连接到一起.这些链接中蕴藏了丰富的语义信息.数据对象之间的相似性也可以通过这些链接体现出来.针对这个特点,提出了一种基于链接聚类的查询算法:利用数据对象之间的链接对数据对象进行聚类,用聚类代替文档来进行LSA处理,有效地减少处理文档的个数;在检索的过程中,寻找与关键字序列相似度最接近的簇,然后将簇内的文档返回给用户.实验结果表明,所提出的方法能够充分利用数据对象之间的链接,聚类效果明显;利用聚类后进行LSA处理,能够成倍地提高空间和时间开销,对精确度有提高作用.
其他文献
双关语被广泛地运用于英语修辞之中,是一种常见的语言现象。双关语非常具有语言表现力,它在语言幽默中扮演着重要的角色。但是中西方有着巨大的文化差异,其中双方的幽默表达
结合城市地下管网系统的特点和需求,综合分析了基于ArcEngine的城市地下管网信息系统的建设方案,以及实现空间数据、属性数据的一体化存储,探讨了城市地下管网信息系统建设的
<正>在联片教研活动中,听了我校朱斌林教师上的公开课,犹如身处一道靓丽的风景线,让人漫步其中、流连忘返、回味无穷,"游"感颇多,现将这节课作如下评说。一、从完成的教学任
文化是财富,更是力量,凝神聚气,鼓舞斗志。疗养管理者应在打造文化型疗养院上下功夫见成效,不断丰富疗养文化,发挥人才科技优势,提升疗养服务的质量,为提高休养员身体素质做
采用超声提取法对含羞草种子中黄酮类物质进行提取,对提取工艺条件如溶剂、配料比、浸泡时间、提取温度、提取时间进行了优化。在单试验的基础上进行正交试验,得出黄酮类物质
<正> 美西律[Mexiletine,1-(2,6—二甲基苯氧基)—2—丙胺]是一种常用的钙通道阻滞剂,具有抗心律失常之功效。其经典分析方法为高氯酸非水滴定法,实验条件苛刻,分析步骤繁琐
<正>2008年美国发生了"次贷危机",进而引发世界性金融/经济危机。原因何在?主要是美国经济出了大问题,表象是由于信贷过度扩张,内在则是结构失衡、经济虚拟化、实体经济停滞
<正>本月第一个星期天,第52届美国超级碗开赛。每年超级碗都能掀起新闻热潮,但话题焦点却并不是赛事本身,而是短短12分钟的超级碗中场秀以及在中场秀期间播放的广告。可以说,
<正>我国是一个音乐多元化的国家,仅就器乐演奏而言,不论是民族民间乐器还是西洋乐器,不论是少数民族乐器还是汉族传统乐器,演奏时都蕴涵着无与伦比的美学价值。当前,如何更
基于简化的受控Markov链软件自适应测试模型大多是研究如何以最小的期望成本检测并移除所有的缺陷,并在构建模型时对部分条件进行特殊化和理想化处理.针对受控Markov链软件测