토픽모델링을 적용한 코로나19 확산에 따른 스포츠영역 이슈분석
이 연구는 토픽모델링을 활용하여 코로나 확산에 따른 스포츠 영역에 이슈를 분석하기 위한 목적으로 수행되었다. 이를 위해 한국언론진흥재단 언론DB인 빅카이즈를 활용하여, 2020년 1월 6일부터 2020년 12월 31일까지 의 스포츠와 코로나의 키워드로 검색되는 국내언론기사를 수집하였다. 수집된 자료 중 중복기사와 관련 없는 기사를 제외하여 최종적으로 2485건의 국내 언론기사를 연구자료로 선정하였다. 분석을 위해 토근화와 명사단어추출, 불필요단어 제거 등의 텍스트 전처리 작업을 하였으며, 토픽수 결정을 위해 토픽수별 Coherenc...
Saved in:
Published in | 한국체육측정평가학회지 Vol. 23; no. 1; pp. 11 - 20 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Korean |
Published |
한국체육측정평가학회
01.03.2021
|
Subjects | |
Online Access | Get full text |
ISSN | 1229-4225 2671-9134 |
DOI | 10.21797/ksme.2021.23.1.002 |
Cover
Summary: | 이 연구는 토픽모델링을 활용하여 코로나 확산에 따른 스포츠 영역에 이슈를 분석하기 위한 목적으로 수행되었다. 이를 위해 한국언론진흥재단 언론DB인 빅카이즈를 활용하여, 2020년 1월 6일부터 2020년 12월 31일까지 의 스포츠와 코로나의 키워드로 검색되는 국내언론기사를 수집하였다. 수집된 자료 중 중복기사와 관련 없는 기사를 제외하여 최종적으로 2485건의 국내 언론기사를 연구자료로 선정하였다. 분석을 위해 토근화와 명사단어추출, 불필요단어 제거 등의 텍스트 전처리 작업을 하였으며, 토픽수 결정을 위해 토픽수별 Coherence Score를 산출하였다. 산출된 결과를 토대로 토픽수를 6개롤 선정하였다. 토픽모델링은 LDA 알고리즘을 적용하였으며 모든 자료처리는 python 3를 사용하였다. 토픽모델링 결과와 토픽별 주요 언론기사 원문을 검토한 결과, ‘프로스포츠 리그 중단 및 무관중 개막’, ‘정부·지자체·학교 온라인 콘텐츠 활성화’, ‘도쿄올림픽 개최 연기’, ‘정부의 스포츠시설 행정조치’, ‘야외 및 온라인 스포츠 수요 증가’, ‘아마추어 대회개최 연기 및 취소’가 코로나 확산에 따른 스포츠 영역의 이슈임을 확인할 수 있었다. 이러한 결과는 뉴노멀 시대 스포츠 영역에서의 전반적인 논의 주제와 동향을 여론을 통해 파악한다는 점에서 의미가 있을 것이며, 스포츠 관계자 및 정책행위자 현장 문제를 진단하고 개선에 있어 고려해야 할 시사점을 제공할 수 있을 것이다. This study is performed to analyze issues in sports field due to spread of COVID-19 by using topic modeling. To this end, domestic news articles were collected which were searched with key word of sports and COVID-19 from Jan. 6, 2020 to Dec. 31, 2020 by using Big Kinds, DB of the press of Korea Press Foundation. Among collected data, unrelated and overlapped news articles were exempted and finally 2,485 domestic news articles were selected as research material. For analysis, text pre-processing such as tokenization, noun word extraction and unnecessary word removal was performed, and the Coherence Score for each topic number was calculated to determine the number of topics. 6 kinds of topics were selected based on calculated result. LDA algorithm is applied for topic modeling, and python 3 is used for all the data processing. As the result of reviewing the topic modeling result and the original of main news articles for each topic, ‘Discontinuance of professional sports league and Opening without spectators’, ‘Activation of online contents at government·local government·school’, ‘Postponement of holing the Tokyo Olympics’, ’Administrative measures for sports facilities by the government’, ‘Increasing demand for outdoor and online sports’, ‘Postponement and cancellation of holding amateur contest’ are confirmed to be issues due to spread of COVID-19 in sports field. This result has meaning in the sense of grasping general discussion subject and trend in the sports field in the new normal era through the press, and can provide implication to be considered for sports officials and policy actors to diagnose and improve on-site problems. KCI Citation Count: 0 |
---|---|
ISSN: | 1229-4225 2671-9134 |
DOI: | 10.21797/ksme.2021.23.1.002 |