论文部分内容阅读
三支决策理论(Three Way Decision,TWD)是二支决策的拓展。在实际应用中,由于信息的不完整和不确定性,人们常常无法立即作出拒绝或接受的决策。所以,当信息不完整不精确时,使用三支决策理论进行数据挖掘是十分有必要的。它将决策粗糙集中的正域解释为接受,将负域解释为拒绝,而将边界域解释为不承诺。根据最小决策风险原则,三支决策给出了一种合理的损失函数条件,即执行一项好的决策的代价要低于延迟决策的代价,而延迟决策的代价低于采取拒绝的代价。以最小决策代价为目标,给出了经典的三支决策的三种决策规则。但是,三支决策理论中的代价函数关系较弱,不能很好的解决类别不平衡问题和代价敏感问题。因此,如何根据实际问题的需要,选择合适的代价函数、是一项值得研究的问题。三支决策理论可用于计算机视觉领域,处理包含不确定性信息和代价敏感的问题。如在图像分类问题中,往往会出现正类的样本较少而负类样本很多的不平衡问题;而在视频异常检测问题中,将视频中的异常行为分类为正常行为的代价要远远高于将正常行为分类为异常行为的代价。如何将三支决策理论应用于计算机视觉中,解决类别不平衡问题和代价敏感问题是本文的关注点。本文的主要工作如下:●针对经典的三支决策理论中代价函数之间关系较弱的问题,提出了强三支决策理论(STWD)及其对偶形式(D-STWD),并给出了基于STWD的决策规则。接着定义了决策因子θ,并分析了它与边界域之间的关系、以及STWD和D-STWD对决策阈值α和β的影响。通过决策表的实例说明了STWD和经典的三支决策理论相比,在特定分类问题中的优势。由于加强了代价函数之间的关系,当处理类别不平衡问题时,可以更加关注少数类的决策代价,使得分类器更关注少数类;当处理代价敏感问题时,更加关注决策代价较高的类。●基于STWD,提出了一种多分类方法STWD-Ensemble,并将其应用于图像分类问题中,主要解决多分类中的类别不平衡问题。并且在决策时充分利用三支决策理论中的三个域:正域、负域和边界域,尽可能的保留图像属于不同类的可能性,对不能立即作出判断的图像通过集成多个基分类器作出最终的决策。实验结果表明,与基于经典三支决策GTWD的多分类算法以及贝叶斯网络、随机森林等经典机器学习算法相比,论文提出的基于STWD的集成学习多分类器算法(STWD-Ensemble)获得更高的准确率、召回率和F-Score值。●将提出的STWD应用于视频异常检测中,主要解决其代价敏感问题。首先用光流法提取底层高维特征,然后通过主题模型进行降维并提取其语义特征,然后用提出的STWD分类器进行分类。实验表明,STWD加强代价函数之间的关系后,比经典的三支决策模型和其他机器学习模型如朴素贝叶斯、随机森林等有更大的优势,特别是在异常行为的召回率和F-Score中有更明显的提升。