基于YOLOv7-R的多车辆目标识别
TP181; 针对智能交通控制对于多车辆目标识别高准确率的需求,基于YOLO算法,提出一种改进的YOLOv7-R算法.将全局注意力机制(GAM)引入骨干网络,增强特征提取性能;利用全维动态高效聚合网络(ODEANet)重构主干网络,提高算法的鲁棒性与精度;使用上下文转换器(CoTNet)替换运算量巨大的可扩展高效聚合层网络(E-ELAN),来引导动态注意力矩阵学习,并降低浮点运算量;采用K-means++聚类算法优化先验帧,提高先验帧的匹配度.通过系统性的改进,车辆多目标识别的效率和准确度均得到提升.在自由流、同步流、阻塞流3种交通流下,分别进行了消融实验.结果表明:YOLOv7-R平均识别率...
        Saved in:
      
    
          | Published in | 东南大学学报(自然科学版) Vol. 54; no. 5; pp. 1260 - 1270 | 
|---|---|
| Main Authors | , , , , , | 
| Format | Journal Article | 
| Language | Chinese | 
| Published | 
            西安工程大学电子信息学院,西安 710048
    
        01.09.2024
     陕西省人工智能联合实验室西安工程大学分部,西安 710000%西安工程大学电子信息学院,西安 710048%西安欧亚学院信息工程学院,西安 170068  | 
| Subjects | |
| Online Access | Get full text | 
| ISSN | 1001-0505 | 
| DOI | 10.3969/j.issn.1001-0505.2024.05.023 | 
Cover
| Summary: | TP181; 针对智能交通控制对于多车辆目标识别高准确率的需求,基于YOLO算法,提出一种改进的YOLOv7-R算法.将全局注意力机制(GAM)引入骨干网络,增强特征提取性能;利用全维动态高效聚合网络(ODEANet)重构主干网络,提高算法的鲁棒性与精度;使用上下文转换器(CoTNet)替换运算量巨大的可扩展高效聚合层网络(E-ELAN),来引导动态注意力矩阵学习,并降低浮点运算量;采用K-means++聚类算法优化先验帧,提高先验帧的匹配度.通过系统性的改进,车辆多目标识别的效率和准确度均得到提升.在自由流、同步流、阻塞流3种交通流下,分别进行了消融实验.结果表明:YOLOv7-R平均识别率分别达到97.13%、94.85%和94.60%,与基线算法相比分别提高了 3.65%、3.20%和1.40%;算法的检测帧率分别为74.63、79.37和75.76帧/s.与基线算法相比,YOLOv7-R的浮点运算量降低3.10%,参数量降低13.37%. | 
|---|---|
| ISSN: | 1001-0505 | 
| DOI: | 10.3969/j.issn.1001-0505.2024.05.023 |