【摘 要】
:
目前大多数流行的图像搜索引擎,都利用从图像的上下文中抽取出来的文本信息来建立索引。这种机制下的检索结果往往含有大量的垃圾信息,因为文本上下文与检索关键词匹配,不一
论文部分内容阅读
目前大多数流行的图像搜索引擎,都利用从图像的上下文中抽取出来的文本信息来建立索引。这种机制下的检索结果往往含有大量的垃圾信息,因为文本上下文与检索关键词匹配,不一定代表图像本身与检索关键词匹配;最关键的是这种机制忽略了图像视觉内容信息本身。针对Google Images图像搜索引擎的检索返回结果,我们提出了一种新的、基于聚类方法的垃圾图片过滤方法。首先,我们对Google Images的检索结果进行图像特征抽取。为了准确得描述图像视觉内容信息,我们采用了三种不同性质的图像特征。同时设计了线性混合内核函数将这些图像特征混合在一起,构建出相似性矩阵。然后,利用K-way Min-MaxCut算法对返回图像进行聚类,与聚类过程相迭代的是线性混合内核的权重系数调整过程,从而各内核系数的设定得以自动完成。聚类完成后,对各个类进行排序。排序的策略是先选出质量最优秀的类,剩余的类再按照其与质量最优类之间的相似性大小进行排序。最后,根据所需的返回图像数目,过滤掉排在末尾的图像类。我们的垃圾图片过滤算法拥有很具竞争力的实验表现。在低召回率的实验中,我们的算法在多数情况下比当前最优秀的过滤算法表现优秀,说明了聚类算法和最优类选择策略的鲁棒性。在多召回率的试验中,我们的算法比Google Images有很好的精度提高表现,说明了类排序算法的有效性。整体来说,我们的算法能切实得对Google Images的检索返回结果过滤垃圾图像。
其他文献
由于电力资源的需求分散在各个城市、各个地区,甚至各个角落,电力管理存在着相当大的困难。同时,为了提高供电效率,达到全社会节能的目的,实施阶梯电价、峰谷实时电价势在必
蛋白质磷酸化是生物体内最重要的一种蛋白质翻译后修饰,目前大量的人类疾病都被证实是由异常的磷酸化修饰所引起的,一些与疾病相关的磷酸化修饰可以被开发为疾病的分子标志或
目前,视频监控系统的应用已经渗透到了许多领域中,各大企业、银行、公共交通都需要一套稳定、可靠和实时的视频监控系统。应用需求的可靠性和实时性,提高了视频监控系统开发
近年来,随着计算机技术、空间技术和现代信息基础设施的飞速发展,以及虚拟现实(Virtual Reality)、三维仿真(3Dimension simulation)、科学计算可视化等技术的出现,为真实再现客
Flash存储器作为一种新兴的存储设备,其体积小、重量轻、低成本、高集成度、抗震动性好等特点使得它在电子产品领域获得了非常广泛的应用。把Flash存储器应用于嵌入式系统中的
随着经济的迅速发展和人民生活水平的不断提高,房地产业已经发展成为国民经济中的支柱产业,也必将在整个国民经济中占据更加重要的地位。同时,对国家GDP的增长起到了很大的贡献
电网是关系国民经济命脉的基础设施和重要资源。随着我国国民经济的快速发展和人民生活水平的日益提高,人民对电力的需求日益增长,电网投资也在逐年加大,如何合理投资,加快电
随着我国整体经济水平的不断提升和互联网事业的不断普及,计算机的应用对于生产和生活的方式的改变提供了一种新的可能。但是,网络的发展也给入侵者提供了更加便利的条件。入侵
无线传感器网络是一种涉及多门学科的综合网络技术,它能够实现数据采集融合和智能网络应用系统,逻辑上将信息世界和真实世界进行了有效的连接,是一种真正的“普适计算”模式。由
随着人们对于公共安全等问题的不断重视,视频监控被应用到越来越多的场景中,从而带来了海量的监控视频数据。传统人工处理的方式已逐渐不可行,我们迫切需要使用计算机来进行