【摘 要】
:
本文的主要工作就是研究自适应信息过滤中提高模板准确性的学习算法和过滤阈值优化的新方法。 给出了一种改进的自适应信息过滤模型,该模型将统计模型(向量空间模型)与概率
论文部分内容阅读
本文的主要工作就是研究自适应信息过滤中提高模板准确性的学习算法和过滤阈值优化的新方法。
给出了一种改进的自适应信息过滤模型,该模型将统计模型(向量空间模型)与概率方法(贝叶斯方法)相结合,通过在向量空间模型中对信息文本与用户需求进行向量表示和相似度计算来实现信息过滤。在需求模板的学习中运用向量中值法来构建初始的需求模板,通过增量学习伪相关反馈信息来提高需求模板的准确性。在过滤过程中以用户反馈信息为先验知识和训练数据,运用高斯指数分布和贝叶斯方法来推测文档的相关性概率,以线性效用函数最优为目标探测最优的过滤阈值。
在模型的训练阶段,给出了运用增量学习方法对附加的少量伪相关文档进行学习来训练需求模板的算法,采用文档词频方法来选择特征,运用Rocchio算法调整特征向量,以此提高过滤模板的准确性;在模型的测试阶段,以过滤系统效能函数最优为目标,给出了探索最优的过滤阈值的新算法。运用Rocchio算法实现系统自主地学习用户定期反馈的信息,并自适应地调整需求模板。
将该模型运用于自建的中文语料上进行相关主题的过滤测试实验,实验结果表明,利用增量学习方法和阈值优化策略,在较少的用户监督下能够有效地提高系统的过滤性能。
其他文献
无线传感器网络由若干传感器节点部署在监测区域,可以根据不同的实际需要完成相应的监测任务。该网络具有应用相关性强的特点,没有通用的路由协议,因此有必要对无线传感器网络路
随着计算机技术、通信技术和网络技术的快速发展,数字家庭网络正逐步进入人们的日常生活。家庭网关作为家庭网络结构中的门户和管理者,直接决定了家庭网络的设计所能达到的性能
随着社会、经济的发展,无线通信技术和无线网络得到了越来越广泛的应用。近年来无线Ad-hoc网络和LEO/MEO卫星网络作为两种新兴的无线多跳网络,逐渐吸引了业界的注意力,成为研
CAN现场总线具有可靠性高,实时性好,同时又具有价格低、容易实现的优点,因此,得到了越来越广泛的应用。论文针对楼宇温湿度自动控制的要求,设计了基于CAN总线的温湿度监控系统。论
随着基于网络的计算机系统在我们的日常生活中起到越来越重要的作用,出于各种原因,这些系统成为我们敌人和罪犯的攻击对象。为了保障系统的安全,我们需要构建一个层次的网络
企业PC设施远程管理系统(Remote Management System for Enterprise PC Facilities)RMS是一套企业级的内部终端PC的管理系统,它以远程网络通信为基础,加上自动智能化的手段,
2006年,压缩感知(CS-Compressive Sensing)理论被提出,解决了数据采集编码端与信息处理解码端设备资源配置与其相应计算任务的复杂性不平衡的矛盾。现有压缩感知理论算法及相
从20世纪90年代开始,在国际网络界就进行了许多关于高性能的网络体系结构的研究。但由于这些研究都是基于传统的层次结构网络,所以虽然它能对网络的性能进行改善,但难以解决
随着网络的快速发展,网络安全问题日益突出,构筑一个全网安全的网络环境成为研究的一个热点。由信息产业部支持的研究课题“网络集成防御系统”,通过对网络中各节点主机的防
1976年Diffie和Hellman提出了公钥密码的概念,信息安全产业由于这一概念的引入得到了迅猛的发展。目前应用最广泛的公钥密码是基于大整数分解问题的RSA算法和基于离散对数问题