基于非均匀划分拟阵约束的图像多样化检索

来源 :云南大学 | 被引量 : 0次 | 上传用户:mybose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的信息检索能够准确地检索出与用户输入关键词相关的信息。但是,用户的意图很难被准确地描述和获取。对于计算机而言,不仅用户的查询意图是模糊的,而且用户输入的查询关键词通常具有二义性。与传统信息检索不同,多样化检索的目的是将相关内容准确地返回给查询用户,同时尽可能全面地覆盖与查询内容相关的主题,以满足广大用户不同的兴趣爱好。也就是说图像多样化检索以图像数据为研究对象,研究如何在多样性和准确性之间取得良好的折衷。本文的主要贡献有两个方面,具体如下:在模型上,我们通过优化目标函数的方式来提高检索结果的多样性。为获得更优质的多样化检索质量,本文以图像数据为基础,综合考虑了用户对整体多样性和类别内部多样性的偏好:即用户不仅喜好整体上能够覆盖丰富主题类别的检索结果同时也偏好同一类别内部冗余度小、差异化大的检索结果。我们将这两种偏好整合到同一个目标函数中,证明了该目标函数具有子模性,并在目标函数上施加了非均匀的划分拟阵约束条件,使得检索结果在能够覆盖广泛的主题类别的同时体现出用户的偏好。同时也证明了使得目标函数的多样性最大化是一个NP-hard问题,最后利用子模函数优化理论求解使多样性最大化的近似解。在算法上,我们提出一个高效率的近似优化算法。首先对类别权重进行调整,其次,在类别簇内通过局部贪心策略求解子模目标函数,能够获得(1-1?0))的近似保证;最后,进一步分析了算法的时间复杂度和空间复杂度。同时,为了更好地提高大规模图像数据检索的效率,我们利局部敏感哈希技术和Spark GraphX分布式计算框架设计分布式并行算法,最后在不同的图像数据集上进行实验,实验从多样性、准确率、加速比、并行效率等多个指标验证了提出方法的有效性。
其他文献
数学概念是数学学习的基础,是帮助学生去分析数学问题,进行数学思维运用,最终达到解决数学问题的目的。数学定义的理解在数学学习过程中相对较难,但是理解定义对于数学的学习来说又是至关重要的第一步,数学定义的讲解是在教学时运用一些手段和方法引入所要学习的概念,以便于学生可以更好地理解概念,概念引入环节在一堂课的整个学习过程中起到了奠定基础的作用。概念引入的形式与教学方法和学生的学习效率有着密不可分的联系。
目的:本研究将收集与整理近年来与中医药联合常规西药治疗冠心病支架术后相关的临床研究结果,对中西医联合治疗冠心病支架术后的疗效进行系统评价。同时运用数据挖掘技术对所
研究目的:分析剖宫产瘢痕妊娠患者初次治疗失败的高危因素,进而为临床诊疗提供参考依据。材料与方法:收集2009年1月至2019年9月就诊于浙江大学医学院附属妇产科医院的剖宫产
近年来,太赫兹科学技术因其特有的魅力在国际上受到广泛的关注,针对太赫兹波源的研究是一个热点方向。基于自由电子受激辐射原理的回旋管因克服了高频结构尺寸与工作波长的共度性,成为了最有可能输出大功率太赫兹波的器件,得到了蓬勃发展。本文中所研究的双阳极磁控注入电子枪,是为0.65 THz二次谐波回旋管提供发射电子的源,因回旋管高频腔截止半径仅1.3 mm,要求的电子注平均引导中心半径为1 mm,回旋管对电
背景与目的:肾细胞癌(renal cell carcinoma,Rcc),是肾实质恶性肿瘤最常见类型之一,肾小管上皮细胞为其细胞来源。肾癌病因复杂,目前已知的有吸烟、药物、病毒及重金属镉等,
糖尿病是常见的内分泌代谢疾病,以胰岛β细胞合成和分泌的胰岛素绝对或相对不足为主要特征,并伴随血糖异常升高,蛋白质代谢和脂肪代谢紊乱。全世界范围内,糖尿病已成为威胁人
近年来,随着大数据、云计算、搜索引擎等在线服务应用的兴起,数据中心网络所承载的流量呈现指数式的增长态势。综合了光电路交换与光分组交换两者优点的混合光交换技术,不仅
设备到设备(Device-to-Device,D2D)通信是无线通信网络中的一个重要技术,蜂窝网络中引入D2D通信技术能够提高频谱利用率、系统吞吐量等系统性能。当D2D用户和蜂窝用户共享频
在自然语言处理中,人机对话系统主要关注如何给真人说的一句话作出合理的回应,这涉及到文本、语音、图形等方面的专业计算机科学知识。传统的对话系统大多数是基于某个领域的
背景特发性炎症性肌病(idiopathic inflammatory myopathies,IIMs)是一组以骨骼肌炎症为主要特征的系统性自身免疫性疾病。心脏损害是成人IIMs常见的脏器受累,且是患者最主要