论文部分内容阅读
面对着web上面的海量信息,Web用户往往只对其中的很小一部分感兴趣。不同的用户,由于他们各自的需求不同,因此他们需要用不同的“角度”、不同的方式去“看待”Web上面的海量数据,他们所关注的那一小部分信息往往有很大不同。在这种前提下,普通的Web搜索引擎,由于其使用的页面评估技术并不考虑各个不同用户的使用习惯和偏好,因此它们不可能满足所有人的需求。
对这个问题的一种解决办法就是建立个性化的Web搜索引擎。所谓的“个性化”,也就是搜索引擎会根据单个用户的习惯自动调整自己的设置,以使检索结果尽量满足该用户的需求。从某种意义上说,个性化搜索引擎就好像为每一个用户单独量身定做了一个搜索引擎。
本文介绍了一个个性化的元搜索引擎的设计与实现。本文中提出使用词汇之间的“相关度”来存储单个用户的个性化信息。并提出了能够在用户进行检索的过程中自动建立针对该用户的“词汇相关度”信息的算法,以及3种不同的利用词汇相关度对底层搜索引擎所返回的结果进行重新评估并进行个性化排序的算法。
本文首先介绍了构建该个性化元搜索引擎所涉及到的相关技术、相关理论和假设。相关技术主要包含与元搜索引擎相关的技术和与个性化服务相关的Web挖掘技术、文本建模技术。理论和假设主要涉及到关于语义与词汇之间的联系与区别的论述。
然后,本文介绍了这个个性化元搜索引擎的总体设计和实现细节。包括文本模型、各个算法的实现,系统地静态模型和动态模型。
接着文本介绍了在该原型系统上进行的实验以及实验结果。得出如下结论:相关度模型是一种有效的个性化技术,它可以大大提高搜索结果的质量。
最后,对本文的内容进行了总结,并提出了进一步的工作方向。