基于旋转框定位的拆垛箱体目标检测
TP391.41; 针对物流领域箱体拆垛场景中,箱体密集堆叠、排列杂乱且来料随机等导致难以精确定位的问题,提出了一种基于旋转框定位的轻量级箱体精确检测方法.在单阶段目标检测网络YOLOv7-tiny的基础上,针对箱体目标密集排列的问题,引入融合多尺度可变形卷积的特征选择模块改善箱体形变建模,提升上下文特征提取能力;融合坐标注意力(coordinate attention,CA)机制以增强目标位置特征表达;采用旋转框长边表示法精确表示箱体边界,并结合高斯分布的KL散度(Kullback-Leibler divergence,KLD)作为损失函数,实现箱体旋转框的高精度回归.实验结果表明,改进方法...
Saved in:
Published in | 计算机工程与应用 Vol. 61; no. 4; pp. 323 - 330 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Chinese |
Published |
江南大学 轻工过程先进控制教育部重点实验室,江苏 无锡 214122
15.02.2025
|
Subjects | |
Online Access | Get full text |
ISSN | 1002-8331 |
DOI | 10.3778/j.issn.1002-8331.2310-0102 |
Cover
Summary: | TP391.41; 针对物流领域箱体拆垛场景中,箱体密集堆叠、排列杂乱且来料随机等导致难以精确定位的问题,提出了一种基于旋转框定位的轻量级箱体精确检测方法.在单阶段目标检测网络YOLOv7-tiny的基础上,针对箱体目标密集排列的问题,引入融合多尺度可变形卷积的特征选择模块改善箱体形变建模,提升上下文特征提取能力;融合坐标注意力(coordinate attention,CA)机制以增强目标位置特征表达;采用旋转框长边表示法精确表示箱体边界,并结合高斯分布的KL散度(Kullback-Leibler divergence,KLD)作为损失函数,实现箱体旋转框的高精度回归.实验结果表明,改进方法在箱体数据集上检测精度AP75达到85.25%,与原模型相比提升了7.85个百分点,箱体中心点平均像素距离小于3个像素,平均偏移角度小于4°,在小幅增加模型参数量的基础上,检测速度达到26.52 FPS,所提方法可以有效提高拆垛箱体的定位精度,满足实际拆垛需求. |
---|---|
ISSN: | 1002-8331 |
DOI: | 10.3778/j.issn.1002-8331.2310-0102 |