基于深度学习的中餐菜品图像分类算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wang213141
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们健康意识的提高,人们更加注重自身的健康问题,中国有句古话:“药补不如食补”,因此,饮食在人们的健康管理中处于核心地位。菜品图像的分类技术可以作为营养均衡、血糖、热量等智能健康管理系统的技术支撑,其有广泛的应用场景。随着深度学习方法的不断完善,其被应用在各种场景中,当然菜品图像分类也不例外。目前,关于菜品图像相关的技术研究主要是针对西餐和日式料理,对中餐菜品的技术研究较少。中餐菜品的形式变化无穷,不同类别的菜品在外形、颜色上可能高度相似,而相同类别的菜品可能差异较大,因此中餐菜品分类仍然是一个充满挑战的课题。本文从多尺度和注意力两个角度研究中餐菜品图像分类技术,提出两种新的菜品图像分类算法。本文主要内容如下:首先,为了解决全连接层对输入尺寸的限制,提出了多尺度采样模块,用于深度卷积神经网络的全连接层前,对图像进行多个尺度的采样。因此允许任意尺寸大小的图像输入到网络模型中,同时减少了全连接层的神经元数量,在保证网络模型准确率的基础下提升了网络模型的训练速度。为了解决中餐菜品图像数据集中各类别样本数量不均衡的问题,网络模型训练的损失函数采用带权的交叉熵损失函数,并且为了降低过拟合的程度,在带权的交叉熵损失函数中加入正则化机制,通过多组对比实验验证了多尺度采样模块的有效性。其次,菜品图像中存在很多类间距离小、类内距离大的细粒度特征,为了更好地对这些细粒度特征进行提取,提出了基于注意力机制的双线性网络,并且从通道和空间两个方向进行注意力网络的构建。通道注意力网络可以根据大量的训练样本自主学习每个通道的特征对分类准确率的影响系数,进而可以对关键的通道特征进行定位,使得网络模型在训练时更加地关注关键通道特征对分类结果的影响,并且对一些干扰分类准确率的信息进行了抑制;受到双线性网络思想的启发,将通道注意力网络作为双线性网络的分支网络,实现细粒度特征的提取,达到提高分类准确率的目的;随后又将空间和通道组成的混合注意力网络加入到双线性网络中,从空间和通道两个方面来准确的表达细粒度特征;同时考虑了双线性网络中两个分支网络不同的组合方式会使得网络对特征的表达不同,通过对不同网络进行组合来选取最佳的组合方式。最后通过多组对比实验验证了双线性网络与注意力网络进行融合的有效性。最后,将笔者训练的卷积神经网络模型的实验效果进行横向对比发现基于注意力机制的双线性网络的分类效果最佳,从而证明了该分类算法的有效性。
其他文献
在市场经济条件下,以客户为中心,强调优质服务,是所有服务型企业的共识。供电企业作为社会服务行业的重要组成部分,其本质是为客户提供稳定的电能和优质的服务。因电力行业长
著名琵琶曲《天鹅》是我国琵琶大师刘德海先生的代表作之一,该作品主要借以天鹅高傲、挺拔、圣洁的形象,由衷地表达了人们对正直、果敢精神的敬仰和追求,堪称当代琵琶作品中
针对情感声学特征在语音情感识别中的重要性问题,运用优先选择、序列前向、序列后向和逐步判别分析进行了特征选择.对说话人和文本均无关、说话人相关2组普通话情感语音进行特征选择,然后利用线性判别分析和支持向量机进行实际识别效果的分析比较.特征选择结果表明,基频、对数能量、语速和第一共振峰均值对普通话情感语音具有较强的判别能力,但情感声学特征的判别力随着说话人的不同而有所差异.特征选择方法比较实验表明,逐
一、蔬菜生产区域的基本条件黔东地区地形多样,且立体性强,海拔高度一般在250~1000米之间,最低的205米,最高的2572余米,海拔级差达2000米左右,气候属中亚热带季风湿润气候区,
中印关系是中国最重要的双边关系之一,也是当今国际关系中最复杂的双边关系之一。历史遗留问题使两国在边界问题上一直存在争议。1959年3月西藏叛乱事件后,中印两国就边界问
分析了我国农村居民生产资料和生活资料需求侧的演变特点与规律,认为当农民的收入水平和恩格尔系数达到小康水平时,满足最低农业生产所需的生产资料和基本温饱的生活资料,不
针对粒子群优化算法应用于约束优化问题时易陷入局部极小值的问题,提出了一种改进的粒子群优化算法.该算法综合了约束优化问题的目标函数值和约束函数的违反度值作为粒子群优化
针对以太网无源光网络的网络规划和算法研究,在IEEE802.3ah标准的基础上,通过扩展开源网络模拟程序Network Simulator Version 2(NS2),完成对以太网无源光网络(EPON)的建模与测试,实现