基于运动区域差分与卷积神经网络的动作识别

TP391; 针对视频动作识别中数据处理效率不高的问题,建立一种基于视频帧间差分序列的动作识别模型.利用帧间差分检测视频帧中的运动区域,以该区域为中心进行相应的图像剪切和增强处理.整个识别模型采用双流架构,在数据样本制作时通过适当的隔帧差分来扩大样本的时间跨度.采用分阶段逐步增加训练样本量的方法,以提升模型识别性能并解决训练过程中易出现的过拟合问题.实验结果表明,该模型可以在CPU级配置的电脑中完成快速动作识别,且在UCF11和UCF25数据集中的识别准确率均高于85%....

Full description

Saved in:
Bibliographic Details
Published in计算机工程 Vol. 45; no. 12; pp. 274 - 293
Main Authors 陈晓春, 林博溢, 孙乾, 张坤华
Format Journal Article
LanguageChinese
Published 深圳大学电子与信息工程学院,广东深圳518060%鹏城实验室,广东深圳,518082%深圳大学电子与信息工程学院,广东深圳,518060 2019
深圳清华大学研究院电子设计自动化实验室,广东深圳,518057%鹏城实验室,广东深圳518082
Subjects
Online AccessGet full text
ISSN1000-3428
DOI10.19678/j.issn.1000-3428.0053623

Cover

More Information
Summary:TP391; 针对视频动作识别中数据处理效率不高的问题,建立一种基于视频帧间差分序列的动作识别模型.利用帧间差分检测视频帧中的运动区域,以该区域为中心进行相应的图像剪切和增强处理.整个识别模型采用双流架构,在数据样本制作时通过适当的隔帧差分来扩大样本的时间跨度.采用分阶段逐步增加训练样本量的方法,以提升模型识别性能并解决训练过程中易出现的过拟合问题.实验结果表明,该模型可以在CPU级配置的电脑中完成快速动作识别,且在UCF11和UCF25数据集中的识别准确率均高于85%.
ISSN:1000-3428
DOI:10.19678/j.issn.1000-3428.0053623