论文部分内容阅读
古村落是我国数千年农耕文化的结晶,具有悠久的历史和深厚的文化价值。建立古村落数字档案库是保护古村落的重要手段,而古村落数量众多,分布广泛,使数字档案的采集变得困难。为了解决这个问题,众包被应用到古村落数字资源采集中,尤其是图像资源。众包方式虽能快速、广泛的获取到这些图像资源,但也存在一些问题:由于众多参与者的不同的技能和设备,他们采集的古村落图像质量参差不一。此外,参与者可能在相似的角度对同一对象连续地拍摄多个图像,多个参与者可能在相似角度和尺度上对这些对象采集图像。因而导致这些图像存在着近似重复。为了保证古村落数字档案库的数据质量,需要对众包参与者交付的图像进行高效、客观的筛选。本文首先对已有的图像特征提取方法和图像质量评价方法进行了调研和总结,然后提出了基于SIFT和BP神经网络的古村落图像筛选模型,以对古村落图像进行筛选。该模型分为两个阶段:基于SIFT和分块颜色直方图的近似重复图像筛选、基于BP神经网络的图像质量筛选。基于SIFT和分块颜色直方图的近似重复图像筛选首先提取图像SIFT特征进行匹配,然后使用分块颜色直方图计算匹配图像的相似度以判定匹配的图像对是否近似重复,最后计算重复图像的NIQE质量评分,保留近似重复图像中质量最好的一幅,筛除其他的质量评分较低的。基于BP神经网络的图像质量筛选先计算图像模糊度、噪声估计、NIQE质量评分,将这些值以及一些图像自身属性作为特征,构建BP神经网络将对图像的操作分为保留或筛除两类,利用已由人工标注保留或筛除标签的数据集训练网络。对于一幅待筛选图像,计算模糊度、噪声估计、NIQE质量评分等特征值,将这些特征输入到已收敛的神经网络,即得到图像质量筛选的结果。最后将本文模型应用到古村落云服务平台,通过古村落图像测试集对模型实现进行测试,验证模型实现的可用性。将筛选结果与人工筛选的结果进行比较,验证其准确性。对于基于BP神经网络的图像质量筛选,对于相同的训练集和测试集分别使用逻辑回归和支持向量机进行对比实验,实验结果表明本文模型具有更好的效果。