强三支决策方法及其在计算机视觉中的应用

来源 :南京大学 | 被引量 : 0次 | 上传用户:huifentongxun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三支决策理论(Three Way Decision,TWD)是二支决策的拓展。在实际应用中,由于信息的不完整和不确定性,人们常常无法立即作出拒绝或接受的决策。所以,当信息不完整不精确时,使用三支决策理论进行数据挖掘是十分有必要的。它将决策粗糙集中的正域解释为接受,将负域解释为拒绝,而将边界域解释为不承诺。根据最小决策风险原则,三支决策给出了一种合理的损失函数条件,即执行一项好的决策的代价要低于延迟决策的代价,而延迟决策的代价低于采取拒绝的代价。以最小决策代价为目标,给出了经典的三支决策的三种决策规则。但是,三支决策理论中的代价函数关系较弱,不能很好的解决类别不平衡问题和代价敏感问题。因此,如何根据实际问题的需要,选择合适的代价函数、是一项值得研究的问题。三支决策理论可用于计算机视觉领域,处理包含不确定性信息和代价敏感的问题。如在图像分类问题中,往往会出现正类的样本较少而负类样本很多的不平衡问题;而在视频异常检测问题中,将视频中的异常行为分类为正常行为的代价要远远高于将正常行为分类为异常行为的代价。如何将三支决策理论应用于计算机视觉中,解决类别不平衡问题和代价敏感问题是本文的关注点。本文的主要工作如下:●针对经典的三支决策理论中代价函数之间关系较弱的问题,提出了强三支决策理论(STWD)及其对偶形式(D-STWD),并给出了基于STWD的决策规则。接着定义了决策因子θ,并分析了它与边界域之间的关系、以及STWD和D-STWD对决策阈值α和β的影响。通过决策表的实例说明了STWD和经典的三支决策理论相比,在特定分类问题中的优势。由于加强了代价函数之间的关系,当处理类别不平衡问题时,可以更加关注少数类的决策代价,使得分类器更关注少数类;当处理代价敏感问题时,更加关注决策代价较高的类。●基于STWD,提出了一种多分类方法STWD-Ensemble,并将其应用于图像分类问题中,主要解决多分类中的类别不平衡问题。并且在决策时充分利用三支决策理论中的三个域:正域、负域和边界域,尽可能的保留图像属于不同类的可能性,对不能立即作出判断的图像通过集成多个基分类器作出最终的决策。实验结果表明,与基于经典三支决策GTWD的多分类算法以及贝叶斯网络、随机森林等经典机器学习算法相比,论文提出的基于STWD的集成学习多分类器算法(STWD-Ensemble)获得更高的准确率、召回率和F-Score值。●将提出的STWD应用于视频异常检测中,主要解决其代价敏感问题。首先用光流法提取底层高维特征,然后通过主题模型进行降维并提取其语义特征,然后用提出的STWD分类器进行分类。实验表明,STWD加强代价函数之间的关系后,比经典的三支决策模型和其他机器学习模型如朴素贝叶斯、随机森林等有更大的优势,特别是在异常行为的召回率和F-Score中有更明显的提升。
其他文献
.NET平台作为微软新的开发平台,其战略思想就是把所有设备通过一个全球宽带网(Internet)连接在一起,同时所有的软件都将成为在该网络上提供的一种服务。Web服务即是实现该战略
随着人类基因组计划实施的不断深入,生物学的数据信息飞速增长,如何从这些海量数据中提取有用的知识,揭示这些数据所蕴含的生物学意义,是对计算机科学的巨大挑战。从结构上来挖掘
近年来,数据挖掘(Data Mining)引起了信息产业界的极大关注,其主要原因是数据海洋的日益增大,我们需要新技术将海量数据转化为有用的信息和知识。分类是数据挖掘的主要任务之一,
随着基因组研究的深入,生物序列的数量呈现爆炸式增长,迫切需要使用高效的计算机算法对其进行处理。生物序列比对是一个重要的,具有挑战性的基本问题,对于推测核酸和蛋白质序列的