超越单一感知的农田害虫检测算法MRA-YOLOX

TP391.4; 目标检测技术正逐步应用于农业,然而在农田害虫检测的运用中仍存在检测速度慢、检测准确率偏低的问题,且仅仅预测害虫的种类和位置信息不足以满足复杂的工程需求.提出一种可以额外预测害虫状态信息的融合MAE和 YOLOX算法的高速高精度农田害虫检测模型 MRA-YOLOX(masked autoencoders and rapid aim detection-exceeding YOLO).算法构建包含近4万张图片以及5万余标注的数据集TDBFP(target detection dataset be used for farmland pests),TDBFP数据集标注了 10种害虫...

Full description

Saved in:
Bibliographic Details
Published in计算机工程与应用 Vol. 60; no. 16; pp. 206 - 216
Main Authors 王中天, 邹颖波, 吴昌霖, 李新
Format Journal Article
LanguageChinese
Published 桂林理工大学 信息科学与工程学院,广西 桂林 541006 15.08.2024
广西嵌入式技术与智能系统重点实验室,广西 桂林 541006
Subjects
Online AccessGet full text
ISSN1002-8331
DOI10.3778/j.issn.1002-8331.2305-0318

Cover

More Information
Summary:TP391.4; 目标检测技术正逐步应用于农业,然而在农田害虫检测的运用中仍存在检测速度慢、检测准确率偏低的问题,且仅仅预测害虫的种类和位置信息不足以满足复杂的工程需求.提出一种可以额外预测害虫状态信息的融合MAE和 YOLOX算法的高速高精度农田害虫检测模型 MRA-YOLOX(masked autoencoders and rapid aim detection-exceeding YOLO).算法构建包含近4万张图片以及5万余标注的数据集TDBFP(target detection dataset be used for farmland pests),TDBFP数据集标注了 10种害虫的生长状态、物种类别以及位置,以便更好地把握害虫信息,从而更准确地制定对策.修改YOLOX模型的解耦头及loss,额外输出生长状态,以改进模型预测更多信息;将ECA(efficient channel attention)和SA(shuffle attention)注意力机制进行有机融合,并插入backbone与 FPN(feature pyr-amid networks)的连接过程以及FPN的通道堆叠过程,以便能够增强获得全局信息和丰富上下文信息的能力,从而取得比单一注意力机制更好的效果;将MAE中自监督解码器部分插入YOLOX的数据增强部分,扩大感受野,增强识别细粒度,获得超越mixup和mosaic的数据增强效果.实验结果表明,当需要同时感知目标的状态、分类和位置时,MRA-YOLOX相较于原始YOLOX模型对于TDBFP数据集的检测精度mAP@0.5由60.1%上升到88.2%,平均检测准确率提高了 18.8个百分点,且检测帧率达到145 FPS,可以用于更复杂的工程实践.
ISSN:1002-8331
DOI:10.3778/j.issn.1002-8331.2305-0318