论文部分内容阅读
随着人工智能技术的迅猛发展,机器已具有通过人脸图像,“理解”人类情感的能力。实现这种能力的方法就是基于机器学习的人脸表情识别,目前的主要应用有人机交互、安全安防、医疗健康等。人脸表情识别有7种基本类别,由愤怒(anger)、高兴(happiness)、悲伤(sadness)、惊讶(surprise)、厌恶(disgust)、恐惧(fear)和平静(neutrality)组成,因此人脸表情识别可用机器学习(分类器)来实现。在实际应用中,由于待识别的人脸表情图片可能包含复杂的背景,图片中人类的外貌、年龄、种族存在差异,不同表情类别之间的区分边界可能模糊不清,这些潜在的问题导致了表情识别准确率难以提高,在现实应用中表现出鲁棒性不足等缺陷。现有人脸表情识别方法的性能与人类的识别能力差距比较大,主要原因是模拟人类的认知能力不够。
机器学习就是向人类学习,每次将人类的认知规律模型化,机器学习方法就取得了显著的原创性,因此论文的主要工作就是将认知规律用于机器学习,提出一些新的机器学习方法,并用于人脸表情识别。具体工作包括以下几个方面:
(1)指出了现有机器学习方法面临的问题,分析了机器学习的惯性思维原理,进而提出了基于认知的机器学习框架,分析了框架中要解决的主要问题,为提出具体的新方法提供思路。
(2)提出了一种新的复杂度感知分类算法(CPC),并应用于人脸表情识别中,该算法针对样本特征分布进行有区分度的学习显著提高了人脸表情识别的分类准确率。实验验证了复杂度感知分类算法的有效性和普适性。
(3)提出了一种新的样本感知的个性化人脸表情识别方法,其采用贝叶斯学习方法从全局选择最优的分类器,然后用选择的分类器识别每个测试样本的情感类别。基于样本感知方法(SAP)从给定的基本分类器中选择最适合对给定的测试样本进行分类的分类器,这更符合人类的认知规律,具有个性化的分类能力。实验表明,SAP在情感识别方面的有效性明显优于任何基本分类器。
(4)机器学习容易形成错觉惯性思维,但目前所有机器学习方法都没有考虑。本文提出一种基于逆向思维的机器学习方法,采用逆向思维克服错觉惯性思维,从而提高了机器学习方法的泛化能力,实验证明所提方法的有效性。所提方法是普适的,对任何机器学习方法都是适用的,特别适用于那些难分的数据集,如非平衡数据集,因为机器学习在那里很容易形成错觉惯性思维。
机器学习就是向人类学习,每次将人类的认知规律模型化,机器学习方法就取得了显著的原创性,因此论文的主要工作就是将认知规律用于机器学习,提出一些新的机器学习方法,并用于人脸表情识别。具体工作包括以下几个方面:
(1)指出了现有机器学习方法面临的问题,分析了机器学习的惯性思维原理,进而提出了基于认知的机器学习框架,分析了框架中要解决的主要问题,为提出具体的新方法提供思路。
(2)提出了一种新的复杂度感知分类算法(CPC),并应用于人脸表情识别中,该算法针对样本特征分布进行有区分度的学习显著提高了人脸表情识别的分类准确率。实验验证了复杂度感知分类算法的有效性和普适性。
(3)提出了一种新的样本感知的个性化人脸表情识别方法,其采用贝叶斯学习方法从全局选择最优的分类器,然后用选择的分类器识别每个测试样本的情感类别。基于样本感知方法(SAP)从给定的基本分类器中选择最适合对给定的测试样本进行分类的分类器,这更符合人类的认知规律,具有个性化的分类能力。实验表明,SAP在情感识别方面的有效性明显优于任何基本分类器。
(4)机器学习容易形成错觉惯性思维,但目前所有机器学习方法都没有考虑。本文提出一种基于逆向思维的机器学习方法,采用逆向思维克服错觉惯性思维,从而提高了机器学习方法的泛化能力,实验证明所提方法的有效性。所提方法是普适的,对任何机器学习方法都是适用的,特别适用于那些难分的数据集,如非平衡数据集,因为机器学习在那里很容易形成错觉惯性思维。