基于动态阈值模型的概率潜在语义分析方法

来源 :郑州大学 | 被引量 : 0次 | 上传用户:gfdsa008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标识别与目标定位是计算机视觉领域的一个重要分支,随着数字图像在互联网上的爆炸式增长,基于图像局部特征的目标匹配开始在图像检索中占据越来越重要的地位,图像的整体分类已很难满足所有的图像检索需求,如何精确而有效地实现目标识别与目标定位成为图像研究领域的一个关键问题。概率潜在语义分析(Probabilistic Latent SemanticAnalysis,PLSA)是一种基于统计学的自然语言处理方法,能够有效挖掘隐藏在文本字面数据下的潜在语义结构,是最早的主题模型方法。在图像应用领域,将PLSA作为一种主题挖掘工具,成功实现了非监督形式的目标识别与目标定位功能。但在实践中存在过度拟合的问题,时常出现主题隶属度不明确和多个主题过度相似的现象。针对以上问题,本文提出一种基于动态阈值模型的PLSA方法,所完成的主要工作包括:(1)提出一种高效的稀疏化方法,通过设置稀疏性控制阈值以达到忽略次要信息,凸显核心主题信息的目的。这种方法合理并有效地限制了每张图像所对应主题的数量,抑制冗余信息,成功解决了主题隶属度混乱的问题。(2)提出了基于语义相似性的主题合并策略。对于不同主题过于相似的问题,根据其语义相似性,动态地决定是否合并相似主题。目的是在确定目标的类信息保存完整的前提下,实现每个目标类只明确地对应于一个主题。这种策略还能够构造主题之间的层次结构关系,通过调整阈值的约束范围,可以实现主题在不同深度上的抽象,挖掘更高层次的潜在数据模式。本文实验表明:与已有的PLSA方法相比,本文所述的方法保持了高可靠度的隐藏模式发现能力,同时大大提高了精确度,并且成功实现了该类方法从无层次结构模型到多层次结构模型的扩展。
其他文献
当前,国内外的许多城市都在推进“泛在城市”、“智慧城市”研究与建设,希望以此为契机带动整个信息产业,乃至促进经济和社会的发展。泛在网中,最为核心的问题是如何确保异构
Ad Hoc网络是一种由移动节点组成的不依赖基础设施的临时多跳网络,由于它具有易部署、分布式等特点,已被广泛应用在很多领域。随着多媒体等业务的发展,对于在Ad Hoc网络中提
基于静息态功能磁共振(resting-state functional magnetic resonance,rs-fMRI)血氧水平依赖(blood oxygenation level dependent,BOLD)信号的脑功能研究已经成为认知神经科学
近年来,关于下一代互联网和物联网的研究成果日渐丰富,新的数据通信和传输方法不断涌现。其中,新的路由协议是新型网络的关键部分,其正确性直接影响着网络的稳定性。然而路由协议
随着经济、社会以及网络技术的发展,如何保障网络上传输的信息的安全性越来越受到人们的重视,信息隐藏技术的研究已成为信息安全领域的焦点。Word2007是办公处理软件的代表产品
目的:精神性疾病是一类广泛影响患者情绪、社交和认知功能的疾病,给患者及家庭带来沉重的生活负担。对精神类疾病的精确诊断、及早干预意义重大。然而,目前对各类精神疾病的
随着计算机网络规模的不断扩大和通信技术的迅速发展,IPv6协议越来越受到关注。IPv6协议拥有超大的地址空间,解决了IP地址匮乏的问题,而且提高了网络吞吐量,可以更方便更好地支持
虚拟实验室能够低成本、方便快捷地实现实验教学,已成为各高校和研究机构实践教学的有效补充。但由于虚拟实验室用户负载的大幅变化,服务器等硬件资源往往按负载峰值数量配置
随着大数据时代的到来以及云计算等先进数据技术的发展,高维数据处理已经渗透到科研和生活的各个方面,在诸如科学研究、生物医学、网络通信等众多领域起到至关重要的作用。作为