基于机器视觉的葡萄产量预估模型关键技术研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:Happyboy123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
精准农业以物联网为基础,通过部署传感器和研究人工智能技术来控制果实/农作物的生产过程,主要包括:农业产量估测、农作物智能化病害检测以及生长过程品质监控等,以更低的成本提升果实产量等级,经济效益更大化。当前,针对葡萄视觉产量预估的工作主要是从基于检测的葡萄串检测和基于回归的葡萄颗粒计数这两个方面进行开展的。然而,这两类方法相对独立,且覆盖场景有限,并伴随着较大的产量预估误差。对此,提出了串-粒融合的两阶段葡萄产量预估框架,阶段一通过先进目标检测器完成葡萄串定位,阶段二通过改进模型完成葡萄计数,并通过两阶段相互融合,提升产量预估精确性。主要贡献如下:(1)归纳并分析现有葡萄产量预估相关工作与公开数据集,将基于传统计算机视觉、基于回归以及定位的人群计数深度学习模型,迁移至葡萄产量预估领域,并分析比较各模型在串级别、颗粒级别葡萄预测的有效性和效率。(2)着眼于当前基于机器视觉葡萄产量预估方法中存在的若干不足,提出了两阶段葡萄视觉产量预估框架TSGYE,充分融合葡萄串与颗粒的特征,实现更低的产量预估方差,同时为了提升计算效率,将原图按葡萄串检测结果裁剪分块,分块图像作为网络输入。(3)针对TSGYE阶段二中,基于回归的葡萄颗粒计数模型准确性不高的问题,基于GBCNet提出带有量级感知的级联网络Joi Net,在葡萄计数方法对比实验中,能够更好识别稀疏区域的葡萄,取得更准确的葡萄密度估计结果;同时迁移学习基于定位的计数方法LSC-CNN至葡萄计数,通过多尺度分支融合提升模型对葡萄定位的鲁棒性,在取得更精准葡萄颗粒定位结果同时,根据葡萄距最近邻居距离,产生葡萄实例的边界框预测,从而更好的辅助展示葡萄颗粒定位结果。(4)针对当前颗粒级别葡萄产量预估数据集的空缺,在已有的公开数据集WGISD与ICRA2015上,完成葡萄颗粒级别点标注,提供葡萄颗粒定位信息,标注后的数据集均公开至Github,并被数据集原作者合并至WGISD项目仓库(1)。(5)部署两阶段网络模型在移动机器人测试平台,论证提出的两阶段葡萄产量预估在机器人平台应用的可能性。
其他文献
随着互联网的迅速发展,二维码凭借着存储信息量大、译码迅速等优势,被广泛应用于身份验证、物流溯源、移动支付等领域。但在采集过程中,受成像环境及中间载体的影响二维码图像很容易造成几何失真,给解码带来了困难,所以,二维码的校正十分关键。在对二维码进行校正的过程中,需要对图像进行重采样的操作,该操作容易出现混叠现象,导致校正后的图像出现新的形变,从而无法识别。因此,研究如何降低二维码图像的混叠问题具有重大
图像超分辨率是计算机视觉与图像处理领域的重要研究课题之一,在视频监控、医学影像、卫星图像等多个方面有着广泛应用。近年来,基于深度学习的单图超分辨率技术得到快速发展,但是为了不断提升高分辨率图像的重建效果,超分辨率方法的网络层数不断增加,使网络的参数量和计算量过高,导致这些方法难以应用于计算资源与存储资源有限的设备上。本文从控制超分辨率算法的计算量、参数量出发研究轻量级单图超分辨率算法,并将其应用于
中国画作为中华民族优秀传统文化的重要组成部分,在漫长的发展过程中形成了独具特色的艺术表现形式。因此,在中国画教学中,应多融入传统文化,这不仅是中国画教学活动开展的基本要求,同时还是传统文化传承发展的重要途径。本文在明确传统文化融入中国画教学意义的基础上,分析了教学活动开展过程中面临的困境,同时结合教学活动开展实际,提出了完善融入路径,以期能为中国画教学改革提供一定的理论参考。
图像分割是计算机视觉领域中一个非常重要的研究课题。图像分割通常用于定位图像中的物体和边界,其目的是简化或改变图像的表示形式,使得图像更容易理解和分析,在目标识别、运动物体跟踪、生物医学图像分析等领域中都有广泛的运用。图像分割的一个核心挑战是由成像设备、照明条件和复杂背景引起的图像灰度不均匀性。虽然目前已有的算法可以很好地分割出灰度均匀图像中的目标物体,但是对灰度不均匀场景则会出现较大误差。由于灰度
循证医学是一种遵循证据的医学实践方式,要求医学从业者慎重、准确且明智地应用当前最好的研究证据来制定患者的治疗方案。在循证医学中,常使用PICO框架描述临床问题。PICO框架将临床问题分解为四个元素:参与者/问题(Population/Problem,P)、干预(Intervention,I)、比较(Construction,C)和结果(Outcome,O)。医学从业者为临床问题筛选研究证据时,希望
随着信息技术的不断普及,越来越多的案件需要使用到电子证据,从网络诽谤到电信诈骗等,电子证据成为破解此类案件的关键。然而电子证据极具脆弱性,十分容易被损坏。传统的电子证据存取证系统存在中心化存储、数据流向不透明、自动化程度不高等问题。并且普通大众缺乏举证能力,遭遇侵权时往往不知如何存证、取证,因为不规范的证据保全可能会导致证据失去法律效力。区块链技术具备数据不可更改、多方维护等特点,有效地解决了电子
阴影技术作为重要的渲染技术之一,在帮助人们理解三维空间中物体的几何形状、大小、及相对位置起着至关重要的作用。由于符号距离场具有能够表达三维空间场景信息的特点被广泛应用于渲染高质量的软阴影效果。然而,现有利用符号距离场进行软阴影渲染的算法由于遮挡率估计不准确,造成半影收缩等问题。针对该问题,在充分研究一阶符号距离场特点的基础上,本文提出了一种基于一阶符号距离场的软阴影改进算法。其基本思想是,通过一阶
随着工业大数据规模的不断扩张,面向工业场景下的大数据智能分析应用逐渐兴起。但在实际应用中,工业数据存在规模量大、分布不集中、结构复杂且类型多样的问题,且由于企业数据分布不均和数据管理能力不佳等因素,使企业在进行所需的数据分析时受到阻碍。因此,如何进一步挖掘工业数据价值成为关注焦点。通过构建数据共享(Data Sharing,DS)平台,加强优势企业的合作和数据开放,可以有效解决企业间的数据孤岛问题
人脸识别技术是计算机视觉领域的一个重要研究方向,有着无接触性、信息采集成本低、自动化程度高等优势,在越来越多的实际场景中都得到了应用。目前为止对于限制场景下的人脸识别技术已经较为成熟,但是对于非限制场景下的人脸识别仍然是一项挑战。其中,复杂的光照条件使得人脸图像出现大范围阴影,图像质量变差;图像中的人脸存在平面旋转、位置偏移、小幅度姿态变化引起识别精度降低;如何全面地利用人脸图像的信息将多种特征进
立体视觉是通过模拟人类的双目视觉,获取环境深度信息的任务,它的原理主要是通过计算成像和数学建模预测物体在三维空间中的深度,以达到还原场景三维信息的目的。立体视觉作为计算机视觉当下最为火热的研究方向之一,被广泛应用在自动驾驶、虚拟现实、增强现实、三维测量与三维重建等热门领域。在计算机立体视觉中,最为常用的方法是双目立体视觉。双目立体视觉的难点在于如何正确建立双目图像之间所有像素的一对一的映射关系。因