基于词项图分析的查询分面挖掘方法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:csc000000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询分面是用于描述查询某一方面内容的一组并列的词或词组.现有的查询分面挖掘方法主要通过模式挖掘搜索结果中包含的高频列表,并利用无监督或有监督的方法对高频列表进行聚类,最终得到查询分面.因为通常采用的搜索结果的数目有限,这种方法挖掘出的查询分面及其包含的分面项的覆盖率不高.针对这一问题,该文提出了一种基于从大规模网页中构建的词项图的查询分面挖掘方法.首先基于大规模网页数据集构建词项图,图中的节点代表词项,边代表两个词项的相似性.针对每个查询,从搜索结果中挖掘出初始分面,然后基于词项图对这些初始查询分面进行扩
其他文献
通过对微分中值定理及其推广形式的研究,给出了一个柯西中值定理推广形式的反问题定理,并加以证明。
安全多方计算作为网络空间安全的关键技术,是密码学的一个重要研究方向,是近年来国际密码学界研究的热点.科学计算是安全多方计算的一个重要分支.集合论是现代数学最重要的基
形状识别是计算机识别领域中的基本问题,可以广泛地应用于对象识别、图像检索、图像配准、目标追踪等各个领域.现在的形状识别方法主要利用形状轮廓上采样点的相关性形成特征描述子,在实际应用中由于缩放、旋转、仿射、射影等变换,无法获取采样点之间的对应关系,形状匹配时间长,识别率低.为了克服基本的特征描述子的局限性,该文提出了一种基于曲率分级的形状编码方法.首先,将射影不变量引入到形状的基本表示中,以保证形状
随着人们对隐私保护问题的关注,无线网络环境下身份认证的匿名问题越来越引起人们的重视.目前大部分匿名身份认证方案都是基于非共享密钥,此类方案计算量大导致资源消耗严重,