基于图像的人脸表情实时识别技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:hj418057259
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在日常生活中,人与人之间最简单、最有效的沟通方式就是面对面交流,但除了语言沟通外,面部表情也可以传递和表达出个体的信息,达到沟通的目的。如今,人们为了追求更好的人机交互体验,表情作为重要的沟通手段,表情识别逐渐成为重点研究课题。传统表情识别算法虽在小样本任务中具有好的表现,但人脸表情复杂,个体间的差异性无法仅靠底层特征去描述,导致识别精度较低,泛化能力差。并且传统识别方法需要科研人员手工提取特征,这需要大量的经验和时间去调节模型相关参数,耗费大量的人力。如今深度学习的不断发展,设计端到端的模型结构可很好的避免人为因素的影响,通过卷积层、激活函数、池化层的共同作用下,将表情信息逐步抽象,所得特征具有较强的判别能力。为此本文为提升表情识别精度及泛化能力,提出了一种基于全局多尺度CNN特征与局部Landmark-SIFT特征融合的人脸表情实时识别系统,具体工作如下:1.设计自定义多尺度卷积神经网络,采用不同尺度的卷积核,整合多个尺度信息去捕获图像中潜在的关联性,提升模型的判别能力。为减少模型参数,降低计算量,引入了批标准化层(BN层)和Dropout策略,同时采用中心损失函数减小类间差异,使模型可适应各种应用场景。2.由于现存人脸表情数据库样本较少,传统手工特征提取算法对小样本具有较好的表现,为此本文设计一种基于全局多尺度CNN特征与局部LandmarkSIFT特征融合的表情识别算法。SIFT描述子抗干扰能力强,将人脸图像经过面部结构点标定后,提取SIFT描述子可将关键点集中在眼睛、眉毛和嘴巴等表情贡献大的区域,通过构建视觉词袋模型将局部特征规范化,最后将所得特征进行融合。3.设计一套人脸表情实时识别系统,此系统可针对静态图片、动态视频以及摄像头实时采集的图像进行识别,该系统可根据人脸做出的表情进行实时的反馈。
其他文献
随着多媒体技术的发展及信息化的普及,图像内容变得越来越复杂,具有多目标、多标签且具有复杂背景的图像在生活中更加常见,给基于内容的图像检索带来了更大的挑战。面对这个问题,部分研究者尝试将目标检测算法应用到图像检索中,但是简单的将目标检测应用于图像检索时,具有一定的缺陷。本文针对这些缺陷,提出了基于目标检测的结合高层语义与底层颜色特征的图像检索方法。本文的主要研究工作有如下两点:第一,针对目标检测算法
随着传统的平面金属-氧化物-半导体场效应晶体管(MOSFET)缩小到20nm以下,栅极氧化物厚度减小,栅极对沟道区域的控制能力减弱。短沟道效应、量子隧穿引起的漏电流增大、高浓度掺杂导致载流子迁移率的衰减等问题愈发严重。而非传统的多栅结构器件增大了与沟道部分的接触面积,栅控能力大大提高,缓解了短沟道效应,改善了亚阈值特性和漏致势垒降低效应。在此背景下,本文基于GTS TCAD仿真软件,对SiGe C
随着我国经济的迅速发展,装配式建筑因为其建造周期短、绿色、环保等优点迎来了新的发展机遇,PC构件是装配式建筑的核心支撑。但是,大多数PC构件制造商仅利用自己的经验来确定配送车辆的配送计划,从而导致缺乏合理的计划,造成了PC构件配送的高成本、低效率等问题,在配送过程中常常出现配送迟到以及车辆在现场等待卸车等现象,同时还能对施工进度计划产生影响从而导致工期的延误,产生很多不必要的成本。因此,通过制定科
近年来,随着大数据、人工智能技术的发展,个性化学习已经成为了教育行业的研究热点。自适应学习系统是一种根据学习者特征提供个性化学习内容的技术或产品,它能够通过数据分析找到学习者的知识盲点或能力短板,为每个学习者规划学习路径,推荐学习资源,从而有效地提高学习效率和质量。自适应学习系统通常包括领域模型、学生模型和自适应模型三个核心组件,其中领域模型是对领域知识或课程内容的结构化描述,是实现学生评价模型和
随着船舶自动识别系统(Automatic Identification System,AIS)设备的强制安装,每天都在产生大量的船舶AIS数据。基于船舶AIS轨迹大数据的船舶类型识别是指利用船舶AIS数据中的轨迹数据识别出船舶的类型。船舶类型识别可以为进一步研究伪装船舶识别、船舶轨迹数据模式挖掘、异常点检测提供技术支持。本文基于船舶AIS轨迹数据实现了渔船(fishing)、货船(cargo)、集
伴随着城市更新、城市体检、城市精细化管理的不断推进,如何有效实现历史街区街巷空间品质的动态监测与变化识别,成为日益受到关注的研究热点。依托物联网和大数据、无人机等技术的发展,街景地图及街景图片识别为历史街区保护发展研究提供了新的思路与方法。本文从街景地图的应用出发,选取适宜的观测点,通过获取历年百度街景图片,构建历史街区研究数据库;以街景图片及其分析处理为目标,构建街巷空间变化识别与评价体系,分析
随着通讯技术的迅猛发展,越来越多的通信应用需要支持多个网络协议同时工作。可重构滤波器是射频前端中的关键部件,其作用是保证射频后端所需通带选择的同时又能满足各类调谐功能。随着5G时代的到来,业内迫切需要小面积、低成本、高性能的射频前端产品。因此能够满足更广范围的大范围带宽可调、具有快调谐速度、较小体积高集成度的可重构滤波器是当前的研究热点。本文首先从理论角度采用奇偶模对谐振器进行了分析,确定好相关参
随着城市的蓬勃发展,为了避免交通阻塞,地铁的建设至关重要,因此对地铁内的行人进行快速精准的检测、对客流进行实时的监测,成为保障地铁安全运营的重要因素。当前计算机视觉推动新技术的产生,行人检测可以借鉴目标检测的思想,但又有不同问题,由于行人的特殊性,姿态衣着各异、尺度多变等问题的存在,使行人检测面临更大挑战。由于地铁环境具有复杂性、特殊性,地铁监控摄像头采集到的行人数据集会存在或多或少的问题,例如:
特色旅游的发展给城镇发展带来了极大的机遇与挑战。对于小城镇来说,立足于其资源特色是其发展的立足之根本。随着越来越多的特色小镇如雨后春笋般破土而出,东三省特色小镇的开发建设速度也在逐渐加快,在黑龙江2020年规划的特色小镇名单中,阿城区的松峰山小镇以其自然资源优势位列其中。发展松峰山特色小镇,可以拉动当地经济,激活地方产业,增加就业机会,提升当地居民获得感、参与感与获得感。同时,在城市化进程中,社会
图像分类是计算机视觉领域中的重要研究课题之一,它已经在多个领域得到了成功的应用,受到了国内外学者们越来越多的关注。图像分类是指根据某种分类规则将图像自动分到一组预定义类别中的过程。图像分类已经被广泛研究,大量图像分类算法被相继提出。概率混合模型因其表达能力强而受到了极其广泛的关注,并成功应用于分类问题,其中包括图像分类。在基于概率混合模型的分类方法中,选择一个合适的概率分布作为基础分布来描述数据的