【摘 要】
:
在近年来,机器视觉的发展紧随人工智能主流,机器人装配视觉依然成为必然趋势,机器视觉和机器人相结合的领域将具有广泛的应用前景,对机器人的灵活性和可操作性的提升具有决定性意义。今天的自动化机器视觉系统是名副其实的多功能化,机器人智能系统可以阅读代码,识别部件,操作机器和控制过程,它们还可以测试产品质量,并为优化生产操作提供有价值的数据,它们的多功能性是无限的。 机器视觉主要由机器视觉测量系统、机器视
论文部分内容阅读
在近年来,机器视觉的发展紧随人工智能主流,机器人装配视觉依然成为必然趋势,机器视觉和机器人相结合的领域将具有广泛的应用前景,对机器人的灵活性和可操作性的提升具有决定性意义。今天的自动化机器视觉系统是名副其实的多功能化,机器人智能系统可以阅读代码,识别部件,操作机器和控制过程,它们还可以测试产品质量,并为优化生产操作提供有价值的数据,它们的多功能性是无限的。
机器视觉主要由机器视觉测量系统、机器视觉部件及特定应用的机器视觉组成。本文主要的研究内容是机器视觉下目标的识别、跟踪以及机器视觉下多种场景的实际应用,首先对人工智能领域下的识别跟踪方法进行了数学推理和分析,并由此进行了VITAL算法的训练,其次针对其实时性较差以及应用领域较窄的缺点进行了改进,此基础上使用了自适应卡尔曼滤波优化,使在采用VITAL识别精确的基础上加强了实时性,最后我们设计了本文算法在无人机追踪和水下机器人识别跟踪的实际实验,对比传统的算法进行了性能分析,得到本文算法性能较优的结论,充分证明本文算法的正确性和可靠性。
其他文献
随着社会信息化程度的不断深化使得对于通信网络的吞吐量及、时延及连接数等性能要求越来越高,这也驱动着通信基础设施及用户设备的持续更新,通信技术也日新月异。其中,大规模多输入多输出(Massive MIMO: Multiple Input Multiple Output)系统是第五代(5G)蜂窝通信系统关键技术之一。大规模MIMO可以通过提供大的空间复用和分集增益来提高性能,被认为是未来通信系统提高数
深度学习是基于人工神经网络的机器学习方法的一种。深度学习具有不同的架构,可应用于计算机视觉,语音识别,自然语言处理等领域。首先,我们研究了基于人工神经网络的深度学习模型。另一方面,神经网络是在输入和输出层之间具有多个层的深度神经网络。这些深度神经网络用于计算机视觉。深度学习具有很强的学习能力,可以从数据集中提取特征。在这些深度神经网络中,一个网络称为卷积神经网络。图像分类是机器学习中的一个重要问题
本文在电信和语音识别系统中考虑了自适应滤波算法的语音增强和降噪问题。在真实嘈杂的环境中存在这些系统会降低其效率并降低其性能。例如,对于电信系统,背景噪声信号破坏传输的语音信号并使其可懂度和质量降低。对于语音识别系统,它们使测试和训练语音信号之间不匹配。 过去已经提出了几种单麦克风增强技术,这里将对其进行讨论。这些技术中的大多数基于噪声平稳性的假设,但是在现实生活环境中,该假设未被广泛验证,这使得
人类语音不仅提供了口语的语义信息,而且还包含了说话者的性别、年龄和情绪等相关特征。在过去十年中,语音识别由于许多原因已经变得必不可少。其中一个原因是它可以用于移动设备的身份识别和准入控制。另外,它还可以通过识别刑事案件中的嫌疑人来最大限度地减少嫌疑人的数量。此外,语音识别系统还可以用于推荐系统来基于人的年龄和性别推荐合适的商品。本论文所设计的年龄和性别识别系统,还可以进一步用于关于特定人群年龄和性
合成孔径雷达差分层析(Differential Synthetic Aperture Radar Tomography, D-TomoSAR)技术是近年发展起来的一项新的空间对地观测技术,它可进行高精度多维成像获得地表的高程以及形变信息。目前,该技术已在地质灾害预警、地球物理参数反演以及城市规划等领域得到了广泛的应用。与此同时,当前星载SAR系统正朝着多平台、多模式、高空间分辨和高重访率方向发展,
双目立体视觉技术作为一种主动测距方法,广泛应用在自动驾驶、虚拟现实、医学成像等领域中。由于制造误差、电路噪声等原因,双目相机实时采集的图像对存在着畸变、噪声污染等干扰,这些干扰会使得立体匹配效果变差。为了生成高质量、高实时性的图像对,本文在对相关理论进行研究分析后,优化、改进了图像畸变矫正算法和中值滤波算法,设计了基于FPGA(Fie1d Programmable Gate Array)的双目立体
在现代工业生产中,随着生产效率的大幅度提升,传统的人工生产方式越来越不能满足现代化制造业的需求,现代化的生产方式需要一种全新的自动化技术,机器视觉技术应运而生。机器视觉应用图像识别技术代替人眼来做测量和判断,效率更高、精确度更好、客观性更强,且可以无休止的重复进行,大大提高了生产的自动化程度。本文对图像识别技术在机器视觉抓取系统中的应用进行研究,研究陶瓷基片识别和位姿获取算法实现抓取,具有一定的实
随着移动互联网的迅速发展,移动网络流量呈现爆发式的突涨。移动用户对于各种内容文件的服务需求也日益增长。因此为了应对这些挑战,非常有必要向下一代移动网络架构引入新的技术应对流量骤增的现状。近些年,在移动网络边缘部署缓存被视为一种很有潜力的技术,通过在基站等边缘设备缓存流行内容,提高内容在网络内部的重复利用性,避免重复内容占用大量的网络资源。然而,移动边缘缓存的性能优化研究整体缺乏全面性与自适应性。同
近年来,大型商场和仓库每年因盗窃而损失的金额达到千亿美元,而商品的盗窃检测系统都有着不完善的地方。传统的视频监控的方式很大程度上受到光线条件的影响,而现有基于射频识别(RadioFrequencyIdentification,简称为RFID)技术的盗窃检测系统不能有效处理一些非人为因素的误报警情况,如RFID系统的检测范围不明确导致可能识别到商场或仓库中未移动的物品,现有的基于RFID的盗窃检测系
随着社交网络的迅速发展,越来越多的用户习惯于通过文本、图像、视频等多种媒体形式分享自己观点,参与其他用户的互动交流。挖掘并捕捉其中蕴含的主观性信息对于舆情分析、市场营销与投资预测等具有重大意义。因此,多模态情感分析已经成为人工智能领域的核心研究课题之一,引起学术界和工业界的共同关注。然而,研究界对交互特性的理解尚未明确与深入,建模交互的研究方法相对简单,以经典概率理论为基础的传统方法在交互建模方面