基于样例池类标改变率的主动学习算法终止准则研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:sharpsmile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主动学习是机器学习的一个研究的热点。当训练集样例特别少,而且获得无类标样例的类别需要付出很大代价时,通过主动学习方法再进可能减少标注代价下获得一个性能较好的学习器,该方法已被广泛应用到图像检索、文档分类、蛋白质结构分析等各个应用研究领域中。很多专家和学者致力于主动学习选择样例策略的研究,即从不同的方面对主动学习策略进行研究与改进,但由于学习器的性能与标注样例数目之间并非呈线性增长关系,即并非标注的样例数目越多,得到的学习器越好。如何在学习器性能和标注样例数目之间取得一个很好的折中,是本论文所研究的问题。本论文通过引入样例池中样例类标的改变率因子作为判断学习器的学习能力。若样例池中样例类标变化率较大,则说明学习器的学习能力较强,有待于进一步完善;而当样例池中样例类标变化率较小时,则说明该学习器的性能达到了较好的水平。当样例池中样例类标改变率小于某个预定的阈值时,则认为此时学习器性能较稳定且达到了一定的预测能力,此时终止算法,不再标注样例。我们在UCI数据集上的实验结果显示,基于样例池类标改变率的主动学习终止策略确实能够选择在选择较少样例的情况下获得一个较好的学习器。
其他文献
约束非线性优化问题在许多领域都有重要的应用,传统的求解方法都是借助于某个惩罚函数作为效益函数-这一类方法统称为惩罚型方法,但惩罚型方法难以选择适当的罚参数,罚参数过小
近年来,图像变形逐渐成为计算机图形学的一块比较热门的领域。它可以有效减少画图工作量,因而在卡通制作等方面有着广泛的应用。   在图像变形领域,有着非常多的算法。本文主
MANET网络以其自身灵活多变的特点赢得了越来越多研究人员的重视。从最早主要应用于军事领域到现在对商业和民用的巨大推动,MANET网络的优势日益突显。虽然其应用领域广泛,研
本论文首先引入了变指数Morrey型Besov和Triebel—Lizorkin空间,然后得到了这些新空间的一些特征.最后研究了二维耗散准地转方程在齐次Morrey型Besov空间上的适定性.全文组织