基于人脸识别的相册管理系统

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:huili1012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,人们用智能手机、数码相机等拍摄的照片越来越多,电脑上相册目录中的照片数量也迅速增长,对这些数字照片的管理变得不可缺少。一般的家庭相册中很大一部分是以人物为主题的照片,这些照片一般是按时间顺序展示的,但当需要查看包含某个人的所有照片时,存在不便于浏览、难以查找等缺点,而手动整理这些数量庞大的照片需要花费的时间和精力非常多。为了解决家庭相册难以管理的问题,本文设计并实现了一款相册管理系统,其基于人脸识别、B/S(Browser/Server)架构、数据库、Python、Java Script等技术实现。其中人脸识别相关技术是系统的关键部分,主要使用了人脸检测、人脸对齐、人脸特征提取、人脸聚类和分类识别等技术。针对人脸检测部分,比较了Haar级联分类器、基于HOG特征的人脸检测器、基于CNN模型的人脸检测器、基于Center Face模型的检测器的性能,选择了基于HOG特征的检测器作为本系统人脸检测的方法。针对人脸对齐部分,比较了5关键点模型和68关键点模型的性能,选择了速度更快的5点模型,平均每张人脸用时为1.9毫秒。针对人脸特征提取部分,测试了dlib实现的基于Res Net的人脸识别模型,其将人脸编码为128维特征向量,平均每张人脸用时为0.65秒(无GPU加速)。针对人脸聚类部分,研究了DBSCAN(Density-Based Spatial Clustering of Applications with Noise)、CW(Chinese Whispers)聚类算法在不同人脸数据集上的聚类性能。结果显示,两者的聚类效果都跟参数的选择有很大关系,不恰当的参数值会使得聚类效果很差。在家庭相册管理系统的应用场景下,本文提出了一种新的方法可以自适应地确定DBSCAN和CW算法的参数取值。这种方法基于一个事实:大部分家庭相册中,一个人的人脸不会在同一张照片中出现两次,即一张照片上出现的多个人脸是属于不同人物的,它们应该被聚类到不同的类簇中。此事实可以作为约束条件用来评估聚类算法的效果,一个好的聚类结果不应过多违反此约束条件(合照约束),并据此定义了Violation Rate。将此方法应用到DBSCAN和CW算法的参数估计中,所得到的参数值在测试所用的数据集上取得了非常理想的效果。经过实验比较,选择了速度更快并可去除噪声的DBSCAN聚类算法。针对人脸分类识别部分,研究了参数取值对KNN(k-Nearest Neighbor,K最近邻)分类算法的影响,确定了使用最邻近的一个已知人脸来识别未知人脸的方法。本文实现的相册管理系统功能包括分页浏览照片、自动按人物身份分组照片、展示人物(分组)列表、交互式地合并或移除人物、交互式地修改照片和人物的关联等。在自建的家庭相册数据集和人物图像数据集Face Scrub的子集上,上述功能均测试通过,按人物自动分组照片的平均精确率为99.2%,平均召回率为90.1%。
其他文献
现代通信技术中,CP-OFDM(Cyclic-Prefix Orthogonal Frequency Division Multiplexing)是被4G LTE(Long Term Evolution)以及5G NR(New Radio)等标准做为物理层调制波形的高效多载波调制技术。而CP-OFDM技术带外辐射严重,不能有效利用空白频谱资源。因此FBMC-OQAM(Offset Quadratu
随着通信技术的不断发展,通信信号调制手段日新月异,传统的调制识别方法难以满足实际需要。在现代化通信对抗中,及时准确地获取信号的调制方式是进行信息提取和干扰引导的重要前提。论文针对现代通信对抗中的通信侦察系统,立足于实战中“实时+准确”的需要,研究设计了一种融合决策树与高阶累积量的调制识别算法,对侦获的信号进行调制分析。论文致力于分析通信信号的统计特征与频谱特性,并对两个具有递进关系的目标进行了研究
中国5G标准的发布及商用化服务的快速推进,给超高清产业带来极大的助力。直播编解码器作为一个负责对直播信号进行实时编解码处理的工业化软硬件产品,是现有高清直播端到端流程中必不可少的一环。目前业内对超高清直播业务场景评测方法认知尚未普及,从而对业务支撑所需的直播编解码器的评测研究工作相对欠缺。因此,有必要研究一种面向超高清的直播编解码器技术评测方法。本文首先分析和研究了超高清视频,特别是HDR相关技术
当前无线移动通信传输数据呈倍数增长,导致频谱资源紧张的现状。传统无线通信发展基于OSI七层模型,物理层专注于从物理频谱带宽等角度逼近通信容量。同时,传统信源信道联合编码研究已经相对成熟,一定程度上从数据无差错传输角度提升信道容量。然而传统信源信道联合编码仍存在诸多问题。一方面,传统信源信道联合编码问题往往通过分离定律将其分解为信源编码、信道编码等若干步骤。分离定律的基本理论是将通信的母问题分解为多
随着5G时代的来临和物联网(Internet of Things)的飞速发展,物联网智能设备不断普及,且数量飞速增加。各类监控器、感知器、包括人们日常使用的移动智能手机,每时每刻都在产生着大量的数据。硬件性能的提升使得互联网的边缘,大到宏基站,主交换机,小到网关服务器,边缘服务器甚至路由器等设备都具有了一定的计算和存储能力。因此,边缘计算的概念被提出来,将数据的实时计算和预处理从云端迁移到边缘,既
乘法运算一直是数字信号处理中不可或缺的数字逻辑运算操作,也是衡量很多数字信号处理器芯片运算性能的主要评价指标。一方面,为了实现较高的精度,数字信号处理器中通常在运算中使用浮点乘法器来代替定点乘法器。另一方面,近些年来在深度神经网络和一些图像处理等容错应用中,可以通过降低部分计算的精度来降低电路的功耗和提高运算性能。针对上述应用领域,本文在深入调研近似计算理论和乘法器电路结构的基础上,研究了近似乘法
情绪,是一种与思维、感知和行为相关的精神状态。探索情绪产生的机理以及情绪在各种不同条件和环境下的变化与特性,可以帮助人们更好地理解自己,可以为开发更加自然、友好的人机交互系统提供技术支撑,也可以帮助实现许多精神疾病的客观评估与辅助治疗。跨文化的情绪差异研究同样也是心理学、认知科学、神经科学和精神医学等学科的一个重要研究分支。已经有许多科学研究发现,对于不同文化背景的人群,对情感的理解存在共性与差异
随着计算机图形学的发展,人们开始对自然界各种物理现象进行模拟。其中,自然界的流体运动是一种看似简单却极为复杂的运动,模拟流体的运动在人们生活中应用极为广泛。然而,在众多流体模拟的算法中,传统数值方法都需要通过迭代运算,这种运算方式往往耗时很长,因此对流体模拟过程的加速研究尤为重要。近年来,在流体模拟的领域中,流体的特征提取是被人们广泛研究的课题。其中基于涡旋细丝的流体特征提取方法可以提供来自现实世
随着GPU的广泛使用,有关GPU资源利用率的提升问题也得到了广泛关注。单应用独占GPU或者时分共享GPU已经不能充分利用GPU上的大量资源了。空分共享GPU是一种常用的提升GPU资源利用率的方法。空分共享GPU可以利用程序之间资源互补来提升GPU资源利用率。现有的空分技术不能支持动态的改变程序的资源数量,单调的资源分配方式限制了应用程序充分利用资源的能力。本文实现了一种可以动态改变程序资源数量的进
为了推动高校教师及时转变角色,提升教育教学效果,本文在以往研究为基础,分析了智慧教育视域下,传统教学正面临的冲击,总结了高校教师角色内涵的拓展,最后探析了教师角色内涵拓展的具体路径。从而使高校教师角色内涵的拓展更有意义。
期刊