CNN 기반 CCTV 동영상 내 보행자 응급 상황 자동 감지 기술 연구
심정지, 뇌졸중 등과 같이 즉각적인 의료적 처치가 필요한 응급 상황은 일반적으로 매우 급작스럽게 발생하기 때문에 신속한 상황 파악이 중요하다. 본 논문에서는 이차원 이미지 내 물체 감지만을 수행하는 Convolutional Neural Network (CNN) 구현 중 하나인 YOLO(You Only Look Once)를 확장해서 CCTV로 촬영한 동영상 속에서 보행자가 갑자기 쓰러지는 응급 상황을 자동으로 인지하고 웹페이지 지도 상에 위치를 표시함으로써 신속한 의료 처리를 가능하게 하는 시스템을 제안한다. 일반적으로 동영상 내 사...
Saved in:
Published in | 디지털콘텐츠학회논문지 Vol. 23; no. 3; pp. 371 - 379 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | Korean |
Published |
한국디지털콘텐츠학회
01.03.2022
|
Subjects | |
Online Access | Get full text |
ISSN | 1598-2009 2287-738X |
DOI | 10.9728/dcs.2022.23.3.371 |
Cover
Summary: | 심정지, 뇌졸중 등과 같이 즉각적인 의료적 처치가 필요한 응급 상황은 일반적으로 매우 급작스럽게 발생하기 때문에 신속한 상황 파악이 중요하다. 본 논문에서는 이차원 이미지 내 물체 감지만을 수행하는 Convolutional Neural Network (CNN) 구현 중 하나인 YOLO(You Only Look Once)를 확장해서 CCTV로 촬영한 동영상 속에서 보행자가 갑자기 쓰러지는 응급 상황을 자동으로 인지하고 웹페이지 지도 상에 위치를 표시함으로써 신속한 의료 처리를 가능하게 하는 시스템을 제안한다. 일반적으로 동영상 내 사물 인식은 CNN과 같은 단일 이미지 인식 기술만으로는 부족하다고 생각되어 동영상에 특화된 많은 연구들이 제시되어 있으나 본 논문에서는 2차원 이미지에 특화된 CNN 기술의 하나인 YOLO를 이용해서 비교적 간단하지만 실용적인 응급 상황 감지 시스템을 구현할 수 있음을 제시한다. 본 논문에서 제안하는 방법의 성능은 실험을 통해 네 가지 성능 지표를 통해 제시한다. Since most medical emergencies including cardiac arrest and stroke happen unexpectedly, it is critical to recognize and respond to the situations immediately. In this paper, we propose an AI-based system which recognizes automatically medical emergencies where pedestrians fall unexpectedly due to their health problems captured in real-time video clips from CCTVs and locates the geometric position on a map on a web page to provide with prompt first aids. To this end, we extend the YOLO (You Only Look Once) network, a variant of the Convolutional Neural Network (CNN) which is suitable for 2D still images, not video. Though many researchers have studied on the methods dedicated to recognize objects in video, with a belief that CNN is not enough to recognize motions, we show that it is possible to build a robust but simple medical emergency detection system by extending the YOLO network - a variant of CNN - that only handles 2D images. Also, we report the performance of the proposed system in four performance measures in this paper. KCI Citation Count: 2 |
---|---|
Bibliography: | http://dx.doi.org/10.9728/dcs.2022.23.3.371 |
ISSN: | 1598-2009 2287-738X |
DOI: | 10.9728/dcs.2022.23.3.371 |