一种基于搜索策略的多主题信息采集方法

来源 :电子学报 | 被引量 : 0次 | 上传用户:wangbenny918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对多主题信息采集效率低下的问题,调研了主题规则在内置搜索引擎和通用搜索引擎上搜索结果的差异,提出将主题规则拆分成原子规则的思想,分析了原子规则间的相同、互换、包含三种关系。在原子规则之间关系的基础上,设计了针对内置搜索和通用搜索不同的原子规则分配策略,这样做一方面提高主题信息采集的准确率,另一方面减少搜索采集的次数。针对原子规则直接搜索结果的准确率不高的问题,提出了基于句群的主题与信息相关性的过滤方法。设置138条主题规则(拆分后的原子规则为8223条),14个内置搜索引擎和4个通用搜索引擎,在单位
其他文献
简述我国利率市场化必要性、进程及主要障碍,探讨利率市场化的应对策略。
本文研究了状态空间为有限集的齐次马尔可夫链,得到极限性态的一些结果,并应用到经济工作。
知识迁移是当前机器学习领域的一个新的研究热点.其基本思想是通过将经验知识从历史任务到目标任务的迁移,达到提高算法收敛速度和收敛精度的目的.针对当前强化学习领域中经
DE算法简单高效,但对复杂问题也存在收敛效率较低的问题,为提高DE算法的全局勘探能力和收敛精度,提出了一种新的精英区域学习动态差分进化算法,算法首先将历史精英保存在精英
近年来,基于 l-多样性的多维敏感属性的隐私保护研究日趋增多,然而大部分多敏感属性隐私保护方法都是基于有损分解的思想,破坏了数据间的关系,降低了数据效用。为此,提出了一种面
针对实际分布式网络中节点通信受限的特点,设计了基于一致性的拍卖算法CDACA (Consensus-Based Decentralized Auctions for Channel Assignment ),实现多段频谱的最优分配。基于
针对当前无需测距定位算法存在定位误差大的问题,本文提出了一种基于接近度的无需测距定位算法,接近度是本文定义的一个用来表示邻居节点距离远近的值。首先根据邻居节点之间的
专利号:200810154881.7陶粒轻质墙板既适应工业化生产的要求,又具有轻质节能的优势,因此在钢结构住宅建筑中应用越来越普遍。陶粒轻质墙板与其它砌体相比较具有以下优势:
分析了经济形势的变化所导致的设备管理形势变化,以及变化后我们在设备管理方面应采取的应对策略。
Dempster-Shafer(D-S)证据理论在不确定性信息处理相关领域具有十分重要的地位,然而对冲突证据进行 Dempster 规则组合时,常常会出现反直观结果的问题。本文提出了一种新的对证据