基于机器学习的用户个性化元搜索引擎的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:skoda0412
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络资源的进一步丰富,原本就为网络查询而生的搜索引擎表现出了它不足的一面。搜索引擎覆盖范围相对减少;访问不均衡;内容陈旧;元数据使用较少;信息分布不平衡等等。 所以元搜索引擎应运而生,至今已获得了极大的发展,但仍有其自身的不足。比如:用户友好性差,适应性不高和缺乏针对性等等。本文就是为解决这些问题而进行的研究。 对用户的输入确定分类内容,从而选择搜索引擎。由于各个成员搜索引擎有各自专长的领域,针对某一方面的查询,应选择调用该领域查询性能较好的成员搜索引擎,动态调用成员搜索引擎。同时,选择的依据包含用户的个人信息以及搜索历史。在执行搜索后,保留搜索引擎的执行效率,作为下次搜索引擎选择的参考依据之一。 选择搜索引擎使用改进的遗传算法,以搜索引擎的集合智能代理为染色体,让它在重组,变异之后通过对搜索引擎的评价得出最优基因,并赋值给每个智能代理的第一个搜索引擎,这样就保证了系统向着正确的方向进化。另一方面,把搜索引擎以xml文件描述的形式保存,以便于搜索引擎成员的添加等行为。 在用户个性化方面,采用了RDF表示用户偏好,然后通过用户偏好的压缩和优化,合并成用户聚类,形成用户向量中心.以推测用户的爱好。需要说明的是用户偏好文件所表达的用户偏好需要有一点的概括力,过分具体的用户偏好,不利于推测;另一方面,用户偏好文件所表达的用户偏好需要有一定的具体性,不能过分概括而失去了实际意义。而搜索结果的按名聚类,使得构建有效地偏好库成为可能。 最后,本文提出了一个完整的元搜索引擎模型。以后的工作将围绕着算法的验证和模型的丰富而进行。
其他文献
目前多数入侵检测系统存在检测率较低、误报率较高,整体性能较低的问题。针对上述问题,探讨了入侵检测系统、神经网络、遗传算法的基本概念及国内外研究现状;在深入分析相关理论
全景视频监控系统,即多路视频流实时传输并对每帧图像进行拼接为全景图,在医学构图、现场监控等很多领域都有十分广泛的应用,而对于视频全景的实时播放仍在研究阶段。视频解
环绕智能被誉为是下一代的信息革命,将极大地改变人们的生活方式。环绕智能系统为了实现自动向用户提供服务的目的,就必须要获取服务对象当前的位置信息。因此如何获取对象的准
电子邮件(简称邮件)是一种用电子手段提供信息交换的通信方式。目前已成为现代社会主要通讯方式之一和互联网上最重要、最普及的应用之一。但是目前所使用的电子邮件传输协议
随着互联网络的日益普及和无线通讯技术的迅猛发展,多媒体通信正逐步成为通信的主要业务。图像/视频的编码与传输技术成为当今信息科学与技术的研究热点。视频信息的庞大数据
当今社会是信息化高度发达的社会,人们与信息的关系达到了之前从来没有过的程度。人类获取和传递信息的手段不再是单单依靠报纸、电话等传统方法,更多的是通过微信、QQ、淘宝
近些年来,信息产业的高速发展,带来了信息技术的空前繁荣。但与此同时,危害信息安全的事件也不断发生,信息安全面临着越来越多的挑战。传统的解决方法是通过加密、解密等技术
网格代表了一种先进的技术和基础设施,其目的是将地理上广泛分布的、异构的资源集合起来进行共享。由于网格资源的广域性、共享性、异构性、自相似性等特征,使得网格资源管理成
从一个巨大的全球新闻来源中在线阅读新闻已经成为阅读新闻文章的一种流行方式。新闻推荐系统帮助用户管理如洪水般的新闻,根据用户对新闻的偏好而不是按顺序展示新闻给每一
IP组播是工作在网络层的从一个源节点向一个组播组的多个目的节点发送数据的一种传输机制。通过合并重复数据传输,源节点只需向所有目的节点发送一个单一的拷贝,而无需向每个节