基于最长顺序频繁词组的Web文献检索结构

来源 :软件学报 | 被引量 : 0次 | 上传用户:yuriany
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,大多数Web文献不能满足不同层次科研人员的查询要求.分析了这一问题产生的原因,提出建立辅助的Web文献检索结构以帮助用户更准确地获取所需文献的思想.基于该思想,设计了通过挖掘最长顺序频繁词组抽取文献特征的算法,提出了能够表现特征之间、文献之间、特征与文献之间关系的扩展的特征层次树结构及其构建方法.实验表明,挖掘最长顺序频繁词组在抽取文献特征方面比常用的TFIDF具有更大的优势.理论分析说明,扩展的特征层次树具有压缩的存储结构、词组与文献关系的表现方式和更好的辅助检索功能.
其他文献
在轮询带宽调度和随机带宽调度两种经典算法的基础上,提出了一种基于邻居集合的带宽资源调度算法来分析和优化WiMAX(world interoperability for microwave access)网络的带宽分
施延霞,一个美丽的名字,总能让人联想到满天霞光的旖旎景致。生活中的她朴实而平凡。每天穿行于熟悉的街巷,恬淡而从容,也许没有人注意过她,然而正是那一行行脚印串起了她平凡的生
提高卫星网络的客错性是一项具有挑战性的工作,故障识别是其中一项根本措施.在采用双层节点图对卫星网络建模的基础上,提出一种基于PMC测试无效模型的卫星网络故障识别算法,并证
提出了一种结合信息伪装和隐藏技术来保护数字高程模型(digital elevation model,简称DEM)数据的方法,保证了DEM数据的安全传输和存储.设计了DEM数据极低比特率压缩方法,压缩数据
网构软件的构建依赖于对开放协同环境中各种异构的、自治的软件服务实体间的有效协同.Internet的开放性与动态性.使得对于诚实的、具有可靠服务质量协同实体的选择难度较大,难以
虽然SVO逻辑由于其简单性在对不可否认协议的形式化分析中得到了广泛的应用,但它在时间描述能力上的不足使得它无法分析不可否认协议的时限性.通过向SVO逻辑添加一种简单的时间
模型转换是MDA(model driven architecture)的核心技术之一,也是目前MDA研究的热点.目前,MDA范畴内存在多种模型转换方法和工具,它们之间的异构性造成了模型转换代码重用的困难
互连网络,例如3-Dtorus拓扑结构,已成功应用于可扩展路由器的设计中.但是,3-Dtorus结构在实际应用时存在设计缺陷,扩展规模受到了限制.提出了一类新型的交换架构,称为蜂巢式路由器.基
借助于Packing问题的思想,提出了一种基于非对称逆布局的模式表示模型(non-symmetry and anti- packing pattern representation model,简称NAM)的彩色图像表示方法.通过描述NAM和彩色图像的二进制位平面分解(binary-bit plane decornposition,简称BPD)方法,给出了一种全新的基于NAM的彩色图像表示算法,并