论文部分内容阅读
目标识别与目标定位是计算机视觉领域的一个重要分支,随着数字图像在互联网上的爆炸式增长,基于图像局部特征的目标匹配开始在图像检索中占据越来越重要的地位,图像的整体分类已很难满足所有的图像检索需求,如何精确而有效地实现目标识别与目标定位成为图像研究领域的一个关键问题。概率潜在语义分析(Probabilistic Latent SemanticAnalysis,PLSA)是一种基于统计学的自然语言处理方法,能够有效挖掘隐藏在文本字面数据下的潜在语义结构,是最早的主题模型方法。在图像应用领域,将PLSA作为一种主题挖掘工具,成功实现了非监督形式的目标识别与目标定位功能。但在实践中存在过度拟合的问题,时常出现主题隶属度不明确和多个主题过度相似的现象。针对以上问题,本文提出一种基于动态阈值模型的PLSA方法,所完成的主要工作包括:(1)提出一种高效的稀疏化方法,通过设置稀疏性控制阈值以达到忽略次要信息,凸显核心主题信息的目的。这种方法合理并有效地限制了每张图像所对应主题的数量,抑制冗余信息,成功解决了主题隶属度混乱的问题。(2)提出了基于语义相似性的主题合并策略。对于不同主题过于相似的问题,根据其语义相似性,动态地决定是否合并相似主题。目的是在确定目标的类信息保存完整的前提下,实现每个目标类只明确地对应于一个主题。这种策略还能够构造主题之间的层次结构关系,通过调整阈值的约束范围,可以实现主题在不同深度上的抽象,挖掘更高层次的潜在数据模式。本文实验表明:与已有的PLSA方法相比,本文所述的方法保持了高可靠度的隐藏模式发现能力,同时大大提高了精确度,并且成功实现了该类方法从无层次结构模型到多层次结构模型的扩展。