基于CNN-RNN深度学习的图片描述方法与优化

来源 :湘潭大学自然科学学报 | 被引量 : 0次 | 上传用户:boysunshine20xy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高模型的泛化能力,将机器翻译的编-解码模型引入图片描述中.首先,提出了CNN-RNN模型:CNN负责编码,RNN负责解码,RNN模型采用LSTM网络.接着,考虑到该模型一定程度上忽略了图片的局部区域特征和图片语义信息,因此又提出改进的CNN-MIL-DRN模型.该模型考虑了属性概率向量,并将多个时刻状态堆叠在一个时刻的计算中,加深了非线性变换的复杂深度.最后,采用MS COCO C5进行模型测试,以AP及5个不用的阈值测试不同指标,同时选取一些目前较新的模型作对比,从而得到CNN-MIL-DR
其他文献
以1,4-亚苯基二(丙基氨基甲酸酯基)桥联硅烷(AM-Si)和正硅酸乙酯(TEOS)为硅源,十六烷基三甲基溴化铵(CTAB)为模板剂,碱性条件下合成了一种新型功能化桥键介孔氧化硅(AM—PMOs),用x射线粉末
针对患者在两次扫描之间出现的位移现象和局部变换以及造影后血管CT亮度接近骨骼组织等问题,提出了基于自适应网格的B样条弹性配准减影方法.该方法通过配准CT血管造影(Computed Tomography Angiography,CTA)扫描和CT扫描影像,将其通过非刚性变换映射到相同的空间中,由CT血管造影影像减掉CT影像,得到造影后的血管.该方法解决了两次扫描之间出现的局部变换的问题,有效地改善了
除了传统的进度、成本、质量三大目标,绿色施工将环境保护、施工安全纳入工程施工中的主要控制目标中,形成更复杂、更全面的多目标管理体系.通过应用集成理论,建立工程项目绿
留守儿童作为中国城市化进程中产生的一个必然产物,一直备受社会的关注,但是目前有关留守儿童的研究还基本处于发展阶段。作为完全本土化的自我概念,自立的内涵、结构、心理
基于离散元方法,采用单轴压缩试验校核了矿石离散元模型的微观参数.利用EDEM软件二次开发出矿石的替换程序,将特定区域的单个矿石颗粒替换为由bond键连接的颗粒团,模拟了高压
以乙酸锂、乙酸锰、乙酸镍和乙酸钴为原料,去离子水为溶剂,乙醇酸作为配位剂,采用溶胶凝胶法分别在800℃、850℃、900℃和950℃烧结制备了0.5Li2MnO3· 0.5Li[Mn1/3Ni1/3
以十六烷基三甲基溴化铵(CTAB)为模板剂,对二亚胺基苯桥联硅烷(AN-Si)和正硅酸乙酯为硅源,在碱性条件下合成了一种新型功能化桥键介孔氧化硅(AN-PMOs).用红外光谱、X射线粉末衍射、
研究弯曲型与剪切型多自由度体系的抗震强度折减系数的差异.采用4条中硬土类场地的地震动记录.以多质点系悬臂柱模拟弯曲型剪力墙结构,抗侧移串联弹簧系统模拟剪切型框架结构。
审美感知是审美心理形成的重要开端。为有效培育儿童对中华优秀音乐的审美感知素养,依据学前儿童音乐审美感知的特征,教师可营造游戏性强的审美情绪场,焕发儿童对中华优秀音