面向小目标检测的改进RetinaNet模型及其应用

来源 :计算机科学 | 被引量 : 1次 | 上传用户:naonao6521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习的目标检测算法广泛应用于工业检测,RetinaNet算法因兼具速度与精度两方面的优势而备受关注,但对于小于32×32像素的小目标,该算法的检测精度不能满足工业检测的要求。为此,文中以增强小目标的训练为基本思路,针对RetinaNet算法进行了如下改进:在采样阶段,将低层特征图P2添加到FPN中,以确保小目标能被充分采样,同时引入自适应训练样本选择策略,以保证增加特征层之后仍能保持足够快的检测速度;在训练后期采用了损失权重调整策略,用于提高小目标中困难样本的拟合度。针对公共数据集MS CO
其他文献
推荐系统致力于从海量数据中为用户寻找并自动推荐有价值的信息和服务,可有效解决信息过载问题,成为大数据时代一种重要的信息技术。但推荐系统的数据稀疏性、冷启动和可解释性等问题,仍是制约推荐系统广泛应用的关键技术难点。强化学习是一种交互学习技术,该方法通过与用户交互并获得反馈来实时捕捉其兴趣漂移,从而动态地建模用户偏好,可以较好地解决传统推荐系统面临的经典关键问题。强化学习已成为近年来推荐系统领域的研究热点。文中从综述的角度,首先在简要回顾推荐系统和强化学习的基础上,分析了强化学习对推荐系统的提升思路,对近年来
全局路径规划是移动机器人室外工作的关键技术,全局路径规划相关算法主要应用于地理场景预知的室外环境中,机器人面对复杂多变的室外环境,通过对算法的优化改进来提高机器人路径规划的实时避障性、路径平滑性、规划有效性就成为了全局路径规划算法的核心研究内容。首先根据算法的智能程度,将移动机器人的全局路径规划算法分为传统全局路径规划算法和仿生智能全局路径规划算法,并深入阐述了实际应用更为广泛的多目标路径规划算法
鉴于上下游企业间的合作模式、顾客的感知价值和环境等不确定等因素,使闭环供应链的决策更加复杂多样化,考虑一个原始制造商和一个第三方回收商构成的闭环供应链,基于顾客感知价值和回收质量不确定的情况,通过构建利润模型并给出严格的数学证明,分析了在原始制造商垄断、Cournot双寡头博弈和Stackelberg博弈3种模式下闭环供应链新产品和再制造产品定价、市场需求和双方利润最优值,以及回收质量和顾客感知价值对决策变量的影响.通过数值仿真分析,验证了模型的有效性,并提出制造商补偿契约,为闭环供应链实现协调和进行决策
稠密子图的查询是图分析领域的重要研究问题之一,在社交用户相关性分析、Web中社群分析等方面都有着广泛的应用。目前,关于稠密子图查询的研究工作主要基于静态图。而在实际应用中,时序信息会对稠密子图查询产生重要的影响,使得图拓扑结构随时间序列不断发生变化,包含的信息量也不断增加,使得已有的针对静态图的查找方法不再适用于时序图。因此,如何高效地在时序图上查找稠密子图仍然是一个挑战。为了解决上述挑战,首先规范化地定义了基于时序图的稠密子图查找问题;然后,根据图的拓扑结构和包含时间标签的边之间的相似度,提出一种基于阈
由于缺乏显式连接词,隐式篇章关系识别是一个具有挑战性的任务。文中提出了一种结合主动学习和多任务学习来间接扩充隐式篇章关系训练数据的隐式篇章关系识别方法,旨在在增强训练数据的同时尽量少地引入伪隐式篇章关系数据中的噪声。首先,基于BERT模型通过主动学习方法的分类不确定性来选择部分显式篇章关系样本;然后,移除显式篇章关系数据中的显式连接词作为伪隐式篇章关系数据;最后,采用多任务学习方法使伪隐式篇章关系数据有助于隐式篇章关系识别。在中文篇章树库(CDTB)上进行的实验的结果显示,相比基准模型,所提方法在宏平均F
阿尔茨海默症是一种典型的涉及多种致病因素的神经系统退行性疾病。然而,阿尔茨海默症的病因尚不明确,病程不可逆转,且无治愈方法,因此其早期诊断和治疗一直是人们关注的重点。受试者的神经影像数据对于该疾病的诊断具有重要的辅助作用,而结合多个模态的数据可进一步提高诊断效果。目前,联合该疾病的多模态数据进行辅助诊断逐渐成为一个新兴的研究领域。在此提出了一种基于自编码器的多模态表示学习方法,用于阿尔茨海默症的诊断。首先将多个模态的数据进行初步融合,得到初级的共同表示;然后将其送入自编码器网络,学习隐空间中的共同表示;最
交通流量信息是智能交通系统和城市计算的重要基础。交通流量数据作为新型时序数据,由于数据的采集方式和外部复杂因素的影响,使得数据缺失现象是常见且无法避免的。如何有效地挖掘交通流量数据的时空特性和数据间的关联成为了提高缺失数据补全精度的关键。传统的统计学方法不能满足日益增长的数据需求,深度学习的应用推动了缺失数据的补全方法向更高的精确度发展。文中深入分析了交通流量的时间特性和空间分布,对交通流量的缺失情况进行了假设,提出了一种UMAtNet(U-net with Multi-View Attention Me
将全局特征与局部特征相结合是提高行人再识别(re-identification)任务识别能力的重要解决方案。以往主要借助姿态估计等外部信息来定位有相应语义的区域,从而挖掘局部信息,这种方法大多是非端到端的,训练过程复杂且缺乏鲁棒性。针对该问题,文中提出了一种能有效挖掘局部信息并且能结合全局信息与局部信息进行端到端特征学习的方法,即多方向分区网络(Multi-orientation Partitio
在许多实际应用中出现了大量的冗余数据,这些数据可能是高维的,这时进行回归预测将会出现过拟合的现象,并且还会出现预测精度偏低等问题。另外,大多数回归方法都是基于向量的,忽略了矩阵数据原始位置之间的关系。为此,文中提出了一种基于样本特征核矩阵的稀疏双线性回归(Kernel Matrix-based Sparse Bilinear Regression,KMSBR)方法。该方法直接将数据矩阵作为输入,其是通过左右回归系数矩阵而建立的,利用样本的特征核矩阵和L 2,1范数,能够同时实现对样本及样本特征的选择,且考
药物-靶标作用关系预测在药物研发以及药物重定位中扮演着重要角色,但现有的机器学习方法在正负样本高度不平衡的数据上仍存在预测能力不足的问题。为此,提出一种基于图卷积神经网络的药物靶标作用关系预测方法。该方法首先构造一个结合多种药物(靶标)相关信息的异质信息网络,然后采用图卷积神经网络在此异质信息网络上学习得到能精确表达每个节点拓扑特征及邻居特征信息的低维向量表征,最后利用这些向量信息通过向量空间投影预测节点间概率的评分。在DrugBank_FDA和Yammanishi_08数据集上进行的药物-靶标作用关系预