MPIIFaceGaze 데이터세트 기반 시선 예측 모델의 효율적인 전처리 기법 및 증강 기법

최근 인공지능과 컴퓨터 비전 분야의 빠른 발전에 따라 시선 추적 기술의 중요성이 증가하고 있다. 시선 추적 정확성 향상을 위해서 제한적인 학습 데이터를 보완하기 위한 다양한 증강 기법들이 널리 활용되고 있으나 기존의 시선 추적 데이터 증강 연구들은 최신 시선 추적 기술의 특성을 올바르게 반영하지 못하고 있다. 따라서 본 연구에서는 현재 상용화된 최신 시선 추적 기술에 적합한 이미지 전처리 및 증강 기술의 조합을 제시한다. 다양한 환경 하에서 시선 추적 학습을 위해 촬영된 MPIIFaceGaze 데이터셋을 기반으로 통계적 이미지 전처...

Full description

Saved in:
Bibliographic Details
Published in디지털콘텐츠학회논문지 Vol. 25; no. 10; pp. 2871 - 2878
Main Authors 김나영(Nayoung Kim), 인다운(Dawoon In), 조시은(Sieun Jo), 박태정(Taejung Park)
Format Journal Article
LanguageKorean
Published 한국디지털콘텐츠학회 01.10.2024
Subjects
Online AccessGet full text
ISSN1598-2009
2287-738X
DOI10.9728/dcs.2024.25.10.2871

Cover

More Information
Summary:최근 인공지능과 컴퓨터 비전 분야의 빠른 발전에 따라 시선 추적 기술의 중요성이 증가하고 있다. 시선 추적 정확성 향상을 위해서 제한적인 학습 데이터를 보완하기 위한 다양한 증강 기법들이 널리 활용되고 있으나 기존의 시선 추적 데이터 증강 연구들은 최신 시선 추적 기술의 특성을 올바르게 반영하지 못하고 있다. 따라서 본 연구에서는 현재 상용화된 최신 시선 추적 기술에 적합한 이미지 전처리 및 증강 기술의 조합을 제시한다. 다양한 환경 하에서 시선 추적 학습을 위해 촬영된 MPIIFaceGaze 데이터셋을 기반으로 통계적 이미지 전처리 기법(HE, CLAHE)과 함께 전형적인 이미지 증강 기술(Albumentation, Transform, Light-Enhancer)이 시선 추적 성능에 미치는 영향을 분석하였다. 이미지 전처리와 증강 기술을 적용하지 않는 경우도 포함하여 총 12가지 조합을 실험한 결과, CLAHE 전처리 기법과 이미지 증강 기술을 적용하지 않은 None 조합이 가장 우수한 성능을 보였다. 실험 결과, 과거 연구에서 크게 주목하지 않았던 통계적 이미지 전처리 기법으로 인한 성능 개선 효과를 얻었다. As artificial intelligence and computer vision rapidly advance, gaze tracking technology is becoming increasingly important. To address the limitations of training data, various augmentation techniques are commonly used to enhance gaze tracking accuracy. However, existing research on gaze tracking data augmentation has not fully considered the characteristics of the latest technologies. In this study, we propose suitable combinations of image preprocessing and augmentation techniques for modern gaze tracking systems. Using the MPIIFaceGaze dataset, we analyzed the effects of statistical image preprocessing methods (Histogram Equalization and Contrast Limited Adaptive Histogram Equalization) and typical augmentation techniques (Albumentation, Transform, Light-Enhancer) on gaze tracking performance. The experiments tested 12 combinations, including the absence of preprocessing and augmentation. The results showed that the combination of CLAHE preprocessing without augmentation achieved the best performance. The experimental results showed performance improvements due to statistical image preprocessing techniques that were not heavily emphasized in previous research. KCI Citation Count: 0
ISSN:1598-2009
2287-738X
DOI:10.9728/dcs.2024.25.10.2871