论文部分内容阅读
随着网络资源的进一步丰富,原本就为网络查询而生的搜索引擎表现出了它不足的一面。搜索引擎覆盖范围相对减少;访问不均衡;内容陈旧;元数据使用较少;信息分布不平衡等等。
所以元搜索引擎应运而生,至今已获得了极大的发展,但仍有其自身的不足。比如:用户友好性差,适应性不高和缺乏针对性等等。本文就是为解决这些问题而进行的研究。
对用户的输入确定分类内容,从而选择搜索引擎。由于各个成员搜索引擎有各自专长的领域,针对某一方面的查询,应选择调用该领域查询性能较好的成员搜索引擎,动态调用成员搜索引擎。同时,选择的依据包含用户的个人信息以及搜索历史。在执行搜索后,保留搜索引擎的执行效率,作为下次搜索引擎选择的参考依据之一。
选择搜索引擎使用改进的遗传算法,以搜索引擎的集合智能代理为染色体,让它在重组,变异之后通过对搜索引擎的评价得出最优基因,并赋值给每个智能代理的第一个搜索引擎,这样就保证了系统向着正确的方向进化。另一方面,把搜索引擎以xml文件描述的形式保存,以便于搜索引擎成员的添加等行为。
在用户个性化方面,采用了RDF表示用户偏好,然后通过用户偏好的压缩和优化,合并成用户聚类,形成用户向量中心.以推测用户的爱好。需要说明的是用户偏好文件所表达的用户偏好需要有一点的概括力,过分具体的用户偏好,不利于推测;另一方面,用户偏好文件所表达的用户偏好需要有一定的具体性,不能过分概括而失去了实际意义。而搜索结果的按名聚类,使得构建有效地偏好库成为可能。
最后,本文提出了一个完整的元搜索引擎模型。以后的工作将围绕着算法的验证和模型的丰富而进行。