自适应信息过滤中使用少量正例进行阈值优化

来源 :软件学报 | 被引量 : 0次 | 上传用户:cayyr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自适应信息过滤中一个大的挑战在于其数据稀疏问题.因此,在对输入的文本流进行过滤的同时学习最优阈值非常重要.提出了一种新颖的阈值优化算法.该算法可以通过少量的正例进行快速的学习,所需数据的获得具有增量性,故而其计算量及所需的存储空间很小.此外,该算法还具有高效、健壮、实用性强等优点.在第10届国际文本检索会议(TREC10)上,复旦大学的自适应信息过滤系统使用了该阈值优化算法,并取得了第3名的成绩.其T10U和T10F分别达到了0.215和0.414.
其他文献
目的:观察苦参碱联合熊去氧胆酸治疗肝内胆汁瘀积的临床疗效。方法:将96例患者随机分为联合治疗组49例采用苦参碱0.15 g静滴,1次/d,加熊去氧胆酸胶囊0.25 g口服,3次/d;对照组47
目的旨在研究中药熏药疗法透入治疗膝骨关节炎的治疗效果。方法根据患者治疗期间的治疗方式将90例膝骨关节炎患者随机分为2组,对照组45例,采用常规外用药物治疗;观察组45例,采用
微分方程是现代科学技术中分析问题与解决问题的一个强有力的工具,在实际中有着广泛的应用。本文探讨了微分方程的基本解法和技巧。