모바일 디바이스 기반의 멀티 모달 사용자 거리 추정 시스템
본 논문에서는 모바일 디바이스에 기본적으로 제공되는 모노 카메라와 모노 마이크의 멀티 모달 입력을 통 하여 사용자와 모바일 디바이스간의 거리를 추정하는 방법을 제안한다. 영상을 이용한 거리 추정은 모노 카메라로 입 력되는 영상에서 피부색 영역을 추출하고, 노이즈를 제거한 후에 얼굴 영역 및 눈 영역을 검출하여 사용자의 거리를 추정한다. 음성을 이용한 거리 추정은 모노 마이크로 입력되는 음성으로부터 가장 큰 피크(Peak)를 선정하고, ROI( Region of Interest)를 지정한 후에 FFT(Fast Fourier Trans...
Saved in:
| Published in | The journal of the institute of internet, broadcasting and communication : JIIBC Vol. 14; no. 2; pp. 65 - 71 |
|---|---|
| Main Authors | , |
| Format | Journal Article |
| Language | Korean |
| Published |
한국인터넷방송통신학회
30.04.2014
|
| Subjects | |
| Online Access | Get full text |
| ISSN | 2289-0238 2289-0246 |
| DOI | 10.7236/JIIBC.2014.14.2.65 |
Cover
| Summary: | 본 논문에서는 모바일 디바이스에 기본적으로 제공되는 모노 카메라와 모노 마이크의 멀티 모달 입력을 통 하여 사용자와 모바일 디바이스간의 거리를 추정하는 방법을 제안한다. 영상을 이용한 거리 추정은 모노 카메라로 입 력되는 영상에서 피부색 영역을 추출하고, 노이즈를 제거한 후에 얼굴 영역 및 눈 영역을 검출하여 사용자의 거리를 추정한다. 음성을 이용한 거리 추정은 모노 마이크로 입력되는 음성으로부터 가장 큰 피크(Peak)를 선정하고, ROI( Region of Interest)를 지정한 후에 FFT(Fast Fourier Transform)을 수행하여 주파수 축에서의 크기(Magnitude)를 계산한 다. 계산된 크기 값과 거리별 크기 값의 모델을 비교하여 거리 별 우도(Likelihood)를 계산하고, 정렬한 후 가중치를 주어 더함으로써 사용자의 거리를 추정한다. 실험결과 영상 및 음성을 멀티 모달 입력으로 이용하여 거리를 추정한 결과 단일 모달로 거리를 추정한 결과 보다 향상된 결과를 얻을 수 있었다. |
|---|---|
| Bibliography: | KISTI1.1003/JNL.JAKO201414753675114 G704-001948.2014.14.2.019 |
| ISSN: | 2289-0238 2289-0246 |
| DOI: | 10.7236/JIIBC.2014.14.2.65 |