图文特征联合的证据图像检索技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:lzwxy105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的快速发展,特别是社会网络的飞速普及,互联网已成为舆论传播的主战场,网络舆论传播使得全民监督力量得到较大程度张扬的同时,也为虚假信息、谣言、网络犯罪提供了土壤。其中,文本是最常使用的舆论传播载体,但是,“百闻不如一见”,由于数字图像能直观的展示事发现场的真实情景,其更容易对大众心理和情感产生巨大冲击,因此,图像正日益受到舆论欺诈者的青睐,图像式的“网络谣言”也被越来越频繁地用在网络舆论欺诈中。图像式网络舆论欺诈所用图像的典型获取方式主要有三种:图像造假、挪用和摆拍。传统的鉴别图像真伪的方法是数字图像真实性鉴别技术,主要通过检测数字图像内容的完整性和真实性来判断图像是否被篡改过。本文研究的图文特征联合的证据图像检索技术使用数字图像举证技术,通过利用Web图像的视觉特征和其伴随文本的特征,在互联网上搜寻与图像式网络舆论欺诈中所使用图像的场景内容相同或相似的图像,从而以它们作为物证来反制图像式网络舆论欺诈。本文的研究目标是图文特征联合的证据图像检索技术,研究内容及本文研究定位的确定主要基于以下三点考虑。首先,证据图像检索问题针对的主要是人物图像尤其是名人相关的图像,因为其在图像式网络舆论欺诈中使用的最为频繁,当前没有公开的针对此应用背景的数据集,故而面向证据图像检索的大规模人物相关的图文数据集是本文研究的数据支撑。第二,证据图像检索不同于传统意义上的图像检索,其问题的本质是计算机视觉领域“以图搜图”形式的近重复图像检索问题,因此近重复图像检索是本文研究的基础内容;第三,当前的近重复图像检索均仅是基于视觉特征,同时利用视觉特征和文本特征来进行证据图像检索的研究还未见公开报道,因此图文特征联合的证据图像检索模式是本文研究的探索创新点。基于以上几点分析,本文主要研究内容和研究成果如下:(1)构建了面向证据图像检索的大规模图文数据集DVPF以互联网为来源,构建了面向证据图像检索的大规模图文信息数据集DVPF(Dataset for Visual Proofs Finding),该数据集包含四个领域1295个名人的2229945幅图像及每幅图像的文档标题、文档正文和图像标题等文本信息,并且系统地分析了数据集的各项特征。综合研究性和应用性,人工标注了40个近重复图像组作为Ground-Truth,以便进行定量实验评测。(2)全面分析和评测了主流的基于视觉特征的近重复图像检索算法在对当前基于视觉特征的近重复图像检索关键技术进行了详细的综述的基础上,重点介绍了Hash签名特征和Bo VW模型,针对Bo VW中的两个主要不足:量化误差和几何信息丢失,系统分析了当前主流的改进算法,最后在数据集DVPF上详细地对Hash签名特征、Bo VW及其改进模型进行了定量实验,根据实验结果分析了每种方法的优缺点,确定Bo VW+HE+WGC和Bo VW+HE+EWGC两种方法作为本文图文特征联合近重复图像检索方法的基础。(3)提出了Text-bounded和Data-driven两种图文特征联合的证据图像检索方法框架根据当前近重复图像检索仅仅依赖视觉特征的现实和互联网图文信息的互相伴随性,结合本文证据图像检索的应用背景,分析了证据图像检索背景下的大规模图文数据集DVPF的数据组织形式,提出了两种可用于证据图像检索的简单有效的文本特征利用模式:先文后图和先图后文,针对这两种文本特征利用模式分别提出了Text-bounded和Data-driven两种证据图像检索框架。实验结果表明,两种框架均有效提高了证据图像检索的精度,检索的平均准确率提高了18.5%。(4)设计与实现了证据图像检索原型系统在全文理论与实验分析的基础上,立足信息系统开发的角度,从需求分析、工作原理、系统设计和系统实现几个方面出发,设计和实现了一个图文特征联合的证据图像检索原型系统,该系统综合了大规模图文数据采集、大规模图文数据处理和前端演示等功能,具有较好的实用性。综上所述,本文以证据图像检索为应用背景,以计算机视觉理论和机器学习理论等知识作为理论基础,针对当前近重复图像检索技术的研究现状,通过联合图像视觉特征和文本特征,围绕证据图像检索背景下的大规模数据集构建、基于视觉特征的近重复图像检索方法、图文特征联合的证据图像检索方法和设计开发证据图像检索原型系统等内容展开研究和实践,对于举证反制图像式网络舆论欺诈具有重要的理论意义和应用价值。
其他文献
该文对油田上常用的含水率计的优缺点进行了分析,认为这些含水率计都存在着一定程度的不足,因此需要新的测量方法来补充.作者结合大庆油田处于高含水期的实际情况:在多大数油
该文对统计滤波领域的一些前沿课题进行了研究和探索,全文的主要工作如下:全面系统地综述了滤波理论,特别是统计滤波理论的发展历程和研究现状.简述了滤波的主要概念以及从模
初始对准是捷联式惯性导航系统的核心技术之一,初始对准的快速性和准确性决定了捷联式惯性导航系统的性能。本文旨在研究捷联惯导系统行进中快速自对准算法。文中首先分析了
2003年“SARS”的爆发,引起了国内学者对非常规突发事件的广泛关注。非常规突发事件的应急决策与处置已经成为国际社会共同面临的重大挑战,传统的“预测-应对”模式难以动态地、实时地应对非常规突发事件。非常规突发事件的应急实时决策应当是基于情景的,“情景-应对”模式已成为当前应急领域学者们广泛认可的模式。国防科大研制的KD-ACP平台旨在构建人工社会,并采用“情景-应对”模式研究非常规突发事件应急管
门禁监控系统实现出入口的控制,通过限制人员和车辆对受控区域的进出,达到确保受控区域安全的目的.该文分析了门禁监控系统的基本结构、实现原理和控制方法,阐述了一种门禁监
该文章在综合国内外大量文献资料的基础上,详细地阐述了碳化过程的复杂性和国内外对该过程控制和优化的发展状况,抓住了碳化过程优化控制的关键问题,即如何控制碳化塔纵向温
遥显技术是无人车导航与控制的一项关键技术。遥显技术的核心是为操作者提供实时、丰富的远端场景信息以保证遥控操作的质量。传统基于图像视觉反馈的遥操作存在摄像机视野有
首先,作为一个长期课题的起始部分,该文较全面地归纳整理了自动化空中交通管理系统的基本概念,较深入地分析讨论了空管研究中的一些关键技术.在此基础上,该文重点对自动化空
该文首先分析了开发农业HPC/PDA专家系统开发平台的必要性和重要性,接着基于农业专家系统、专家系统开发平台和HPC/PDA的国内外研究现状,提出了开发HPC/PDA专家系统开发平台
该文主要研究隐式曲面的求交及多边形化问题中的算法,介绍了隐式曲面与参数曲面的相互转化;对隐式曲面的求交问题,给出了一种快速跟踪隐式曲面与参数曲面的交线的算法;对隐式