基于边卷积与瓶颈注意力的点云三维目标检测

TP183; 点云数据的高度稀疏特性使当前大部分基于点云的三维目标检测算法对点云的局部特征学习不足,且点云数据包含的部分无效信息会干扰目标检测.针对以上问题,提出了一种基于边卷积与瓶颈注意力的三维目标检测模型.首先,构建多层边卷积(Edge Convolution,EdgeConv),针对点云中的每个点,通过寻找特征空间上与其最接近的K个点,以构建K-近邻图结构,并学习点云的多尺度局部特征;其次,设计适用于三维点云数据的瓶颈注意力模块(Bottleneck Attention Module,BAM),每个BAM包括一个通道注意力模块和一个空间注意力模块,用于增强对目标检测有价值的点云信息,提升...

Full description

Saved in:

Bibliographic Details
Published in	计算机科学 Vol. 51; no. 5; pp. 162 - 171
Main Authors	简英杰, 杨文霞, 方玺, 韩欢
Format	Journal Article
Language	Chinese
Published	武汉理工大学理学院武汉 430070 2024
Subjects	VoteNet 瓶颈注意力模块 SUN RGB-D dataset Bottleneck attention module ScanNetV2数据集 SUN RGB-D数据集 3D object detection 三维目标检测点云边卷积 Point clouds ScanNetV2 dataset Edge convolution
Online Access	Get full text
ISSN	1002-137X
DOI	10.11896/jsjkx.230300113

Cover

More Information
Summary:	TP183; 点云数据的高度稀疏特性使当前大部分基于点云的三维目标检测算法对点云的局部特征学习不足,且点云数据包含的部分无效信息会干扰目标检测.针对以上问题,提出了一种基于边卷积与瓶颈注意力的三维目标检测模型.首先,构建多层边卷积(Edge Convolution,EdgeConv),针对点云中的每个点,通过寻找特征空间上与其最接近的K个点,以构建K-近邻图结构,并学习点云的多尺度局部特征;其次,设计适用于三维点云数据的瓶颈注意力模块(Bottleneck Attention Module,BAM),每个BAM包括一个通道注意力模块和一个空间注意力模块,用于增强对目标检测有价值的点云信息,提升网络模型的表征能力.网络以VoteNet为基线,多层边卷积和BAM模块依次加入PointNet++网络和投票模块之间.模型在SUN RGB-D和ScanNetV2公共数据集上进行实验,并与13个当前先进的三维目标检测算法进行对比.实验结果表明,对于SUN RGB-D数据集,所提模型在交并比(Intersection over Union,IoU)为0.5时的平均精确率mAP@0.5达到了最高,并在床、椅子、办公桌等6个对象类别(共10个类别)达到最优准确率(AP@0.25);对于ScanNetV2数据集,模型的mAP@0.25和mAP@0.5均达到最优,并在椅子、沙发、照片等10个对象类别(共18个类别)达到了最优准确率(AP@0.25).与基线VoteNet相比,所提模型在两个数据集上的mAP@0.25分别提升了 6.5％和12.9％,消融实验证明了所加入的边卷积模块和瓶颈注意力模块的有效性.
ISSN:	1002-137X
DOI:	10.11896/jsjkx.230300113