공공 자전거 수요 예측을 위한 사이킷런의 지도 기계 학습 모델 성능 비교

본 연구는 공공 자전거 수요 예측을 위해 사이킷런에서 제공하는 기계 학습 모델들의 성능을 비교 평가를 하였다. 공공에서 제공하고 있는 신뢰성 있는 데이터를 실험에 사용하였는데, 서울시가 제공하는 ‘서울시 공공자전거 이용정보’ 데이터와 기상청이 제공하는 ‘날씨 정보’를 활용하였다. 사이킷런 지도학습의 모델인 랜덤 포레스트, 그래디언트 부스팅, 결정 트리, 선형 회귀를 사용하였고, 성능을 비교 분석하기 위해 RMSE, R2, RMSLE, 정확도를 계산하여 평가 지표로 사용하였다. 그 결과 랜덤 포레스트 모델이 RMSE 347.37, R...

Full description

Saved in:
Bibliographic Details
Published in디지털콘텐츠학회논문지 Vol. 24; no. 6; pp. 1305 - 1315
Main Authors 권혜진(Hye-Jin Kwon), 하진영(Jin-Young Ha)
Format Journal Article
LanguageKorean
Published 한국디지털콘텐츠학회 01.06.2023
Subjects
Online AccessGet full text
ISSN1598-2009
2287-738X
DOI10.9728/dcs.2023.24.6.1305

Cover

Abstract 본 연구는 공공 자전거 수요 예측을 위해 사이킷런에서 제공하는 기계 학습 모델들의 성능을 비교 평가를 하였다. 공공에서 제공하고 있는 신뢰성 있는 데이터를 실험에 사용하였는데, 서울시가 제공하는 ‘서울시 공공자전거 이용정보’ 데이터와 기상청이 제공하는 ‘날씨 정보’를 활용하였다. 사이킷런 지도학습의 모델인 랜덤 포레스트, 그래디언트 부스팅, 결정 트리, 선형 회귀를 사용하였고, 성능을 비교 분석하기 위해 RMSE, R2, RMSLE, 정확도를 계산하여 평가 지표로 사용하였다. 그 결과 랜덤 포레스트 모델이 RMSE 347.37, R2 0.74, RMSLE 0.51, 정확도 67.61%로 가장 성능을 보였다. 그래디언트 부스팅과 결정 트리 모델은 랜덤 포레스트보다 다소 낮은 성능을 보였지만, 선형 회귀의 성능은 현저하게 낮음을 확인할 수 있었다. 다양한 모델들을 활용한 수요 예측 분석을 통해 최적의 모델을 선정하여 수요 예측 오차를 줄여 나가는 데 도움이 될 수 있을 것으로 판단한다. This study compares and evaluates the performance of machine learning models provided by scikit-learn for predicting public bicycle demand. Reliable data provided by the government, namely "Seoul public bicycle usage information" provided by the Seoul Metropolitan Government and "weather information" provided by the Korea Meteorological Administration, were used for the experiment. Supervised learning models in scikit-learn, namely random forest, gradient boosting, decision tree, and linear regression, were used, and performance was evaluated using RMSE, R2, RMSLE, and accuracy. The random forest model showed the best performance with an RMSE of 347.37, R2 of 0.74, RMSLE of 0.51, and accuracy of 67.61%. The gradient boosting and decision tree were the next best-performing models, whereas the linear regression had the worst performance, as expected. Thus, from the various models for demand prediction analysis, the optimal model can be selected to reduce demand prediction errors. KCI Citation Count: 0
AbstractList 본 연구는 공공 자전거 수요 예측을 위해 사이킷런에서 제공하는 기계 학습 모델들의 성능을 비교 평가를 하였다. 공공에서 제공하고 있는 신뢰성 있는 데이터를 실험에 사용하였는데, 서울시가 제공하는 ‘서울시 공공자전거 이용정보’ 데이터와 기상청이 제공하는 ‘날씨 정보’를 활용하였다. 사이킷런 지도학습의 모델인 랜덤 포레스트, 그래디언트 부스팅, 결정 트리, 선형 회귀를 사용하였고, 성능을 비교 분석하기 위해 RMSE, R2, RMSLE, 정확도를 계산하여 평가 지표로 사용하였다. 그 결과 랜덤 포레스트 모델이 RMSE 347.37, R2 0.74, RMSLE 0.51, 정확도 67.61%로 가장 성능을 보였다. 그래디언트 부스팅과 결정 트리 모델은 랜덤 포레스트보다 다소 낮은 성능을 보였지만, 선형 회귀의 성능은 현저하게 낮음을 확인할 수 있었다. 다양한 모델들을 활용한 수요 예측 분석을 통해 최적의 모델을 선정하여 수요 예측 오차를 줄여 나가는 데 도움이 될 수 있을 것으로 판단한다. This study compares and evaluates the performance of machine learning models provided by scikit-learn for predicting public bicycle demand. Reliable data provided by the government, namely "Seoul public bicycle usage information" provided by the Seoul Metropolitan Government and "weather information" provided by the Korea Meteorological Administration, were used for the experiment. Supervised learning models in scikit-learn, namely random forest, gradient boosting, decision tree, and linear regression, were used, and performance was evaluated using RMSE, R2, RMSLE, and accuracy. The random forest model showed the best performance with an RMSE of 347.37, R2 of 0.74, RMSLE of 0.51, and accuracy of 67.61%. The gradient boosting and decision tree were the next best-performing models, whereas the linear regression had the worst performance, as expected. Thus, from the various models for demand prediction analysis, the optimal model can be selected to reduce demand prediction errors. KCI Citation Count: 0
Author 하진영(Jin-Young Ha)
권혜진(Hye-Jin Kwon)
Author_xml – sequence: 1
  fullname: 권혜진(Hye-Jin Kwon)
– sequence: 2
  fullname: 하진영(Jin-Young Ha)
BackLink https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002973176$$DAccess content in National Research Foundation of Korea (NRF)
BookMark eNotjE1LAkEAhocwyMw_0GkuXYLd5mN3Z_coZiVIQnjotsx-TCzWGisduoXsQYTIQ4KF9nGIIjooJtlf2h3_Q1bCC897eHjWQSZshD4AmxipFiPmjuc2VYIIVYmmGiqmSF8BWUJMpjBqHmdAFuuWqRCErDWQbzYDB-mUMkYIyQInmUwXg_KhK5_iZDyCst2X97dQ9tty9iyHMZSDeN4bQNn6kMPPeesrfRzJYR_K16v0JobJbJRMYjjv3cnOFKbvb-n1DMp4nHZeYPodJ9PuBlgV_LTp55fMgdpeqVY8UCrV_XKxUFFCQ8cK9R1BOGXCwdzwdNMUwhXccRh1KTc4JUiYPhO6sFyiY2JYTFtYlqdxx6C-hmgObP9nw0jYdTewGzz440nDrkd24ahWtjEiBjGtX3lrKV9EwZnvBdw-XxweXdqH1d0SxpqmWQjTH2DahYQ
ContentType Journal Article
DBID DBRKI
TDB
ACYCR
DOI 10.9728/dcs.2023.24.6.1305
DatabaseName DBPIA - 디비피아
Nurimedia DBPIA Journals
Korean Citation Index
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
DocumentTitleAlternate Performance Comparison of Scikit-Learn's Supervised Machine Learning Models for Public Bicycle Demand Prediction
DocumentTitle_FL Performance Comparison of Scikit-Learn"s Supervised Machine Learning Models for Public Bicycle Demand Prediction
EISSN 2287-738X
EndPage 1315
ExternalDocumentID oai_kci_go_kr_ARTI_10262890
NODE11444901
GroupedDBID ALMA_UNASSIGNED_HOLDINGS
DBRKI
M~E
TDB
ACYCR
ID FETCH-LOGICAL-n651-3ebf2a37fb1a6d588ffcfabb73c3a6a320f8e7f5f9c25126974d589d4ab63e403
ISSN 1598-2009
IngestDate Wed Apr 23 03:12:09 EDT 2025
Thu Feb 06 13:29:55 EST 2025
IsPeerReviewed true
IsScholarly true
Issue 6
Keywords 데이터 분석
공공자전거
수요 예측
파이썬
Demand Prediction
Public Bicycles
Data Analysis
기계 학습
사이킷런
Machine Learning
Scikit-Learn
Python
Language Korean
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-n651-3ebf2a37fb1a6d588ffcfabb73c3a6a320f8e7f5f9c25126974d589d4ab63e403
Notes http://dx.doi.org/10.9728/dcs.2023.24.6.1305
PageCount 11
ParticipantIDs nrf_kci_oai_kci_go_kr_ARTI_10262890
nurimedia_primary_NODE11444901
PublicationCentury 2000
PublicationDate 2023-06
PublicationDateYYYYMMDD 2023-06-01
PublicationDate_xml – month: 06
  year: 2023
  text: 2023-06
PublicationDecade 2020
PublicationTitle 디지털콘텐츠학회논문지
PublicationYear 2023
Publisher 한국디지털콘텐츠학회
Publisher_xml – name: 한국디지털콘텐츠학회
SSID ssib053377222
ssib008451574
ssib049971524
ssib036278589
ssib053682487
Score 2.234907
Snippet 본 연구는 공공 자전거 수요 예측을 위해 사이킷런에서 제공하는 기계 학습 모델들의 성능을 비교 평가를 하였다. 공공에서 제공하고 있는 신뢰성 있는 데이터를 실험에...
SourceID nrf
nurimedia
SourceType Open Website
Publisher
StartPage 1305
SubjectTerms 컴퓨터학
Title 공공 자전거 수요 예측을 위한 사이킷런의 지도 기계 학습 모델 성능 비교
URI https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11444901
https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002973176
Volume 24
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX 디지털콘텐츠학회논문지, 2023, 24(6), , pp.1305-1315
journalDatabaseRights – providerCode: PRVHPJ
  databaseName: ROAD: Directory of Open Access Scholarly Resources
  customDbUrl:
  eissn: 2287-738X
  dateEnd: 99991231
  omitProxy: true
  ssIdentifier: ssib053682487
  issn: 1598-2009
  databaseCode: M~E
  dateStart: 20000101
  isFulltext: true
  titleUrlDefault: https://road.issn.org
  providerName: ISSN International Centre
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrR1Na9VAMNR60IsoKtaPEtA9lTzzkk2ye8xXeVaslyf0FpJ9iZTCq5QW0YNIyaEUxB4sVGn9OIgiHlpqsf4Vf8J76X9wdjcviR_gB0LIW2ZmZ2dnMrszj_1QlGuM9JhDdXCkOMEaThymEQtnmpGBW1KI8VkiVvnO2p07eGbOmhs79rWxamllOWmxh7_cV_IvVgUY2JXvkv0Ly1ZMAQBlsC-8wcLw_iMbo9BFnok8qypModBHNERU5wVXRwQLXBt5usARgigRRC6iWJITDoWCR5DbFpAA6kmcLzgEiFpQlhwM5PollSdwAPEcFHqITkMzJYoSQe06fC0F4Mi05OnyZjiVkFiAJHcqmLuyEx5yXeQSURGakbxAEugIBwFOUnl01EPgoDcjbSEP5k8tRSBYyL4GQg8AsUpl8d7rDWECriLii_Ys5ImC65fVBcPRxyratwWt4Er9EQmG-L3zINVm5vtTN-_zKJvWlWRLpKYtbQFzC4EKmhiIpzrxqFL534xh1mvIhDdV5in14Ab_q-_NGYsKp5CSpAJmQBqsOaa4s7ma5uRW9dKdm3MWRDFWI_5pm3J_7Y9zK3UMvl-kx_gh94bZMnDLbtV1vzuzfPZ2EEKijTHlWyuPGzDj8mtVbj0Kq7GeYIik69QD4iiHWPXNB5CIOxBaVnjISiAPrI-atEybGFjcf1lpQO6J43Je_1lKiB37SxBynuiv8HszYPBtxJHd08qpMgFUXenNZ5SxhcWzSjLYP4BHLV5uFK_zwd6uWqxtFS-eqcXWWnH4ptjJ1WI7P9rcVovVj8XOp6PVz8NXu8XOllq8ezx8mquDw93Bfq4ebT4v1g_U4Yf3wyeHapHvDdffqsMv-eBg45zSnQ67fkcrbz_R-rbV1sw0yYzYdLKkHds9i5AsY1mcJI7JzNiOTUPPSOpkVkYZT1Fs6mCgoj0cJ7aZYt08r4z3F_vpBUW1Y8ZowjLSBq3HthODIjMcW8A-dRgjE8pVUE20wOYjftg8_727GC0sRZBS34ggA7H5aoQJZbJSXXRPHoUTNQ198XcEl5STtZNcVsaXl1bSKxDSLyeT4tv4BvGMxOA
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%EA%B3%B5%EA%B3%B5+%EC%9E%90%EC%A0%84%EA%B1%B0+%EC%88%98%EC%9A%94+%EC%98%88%EC%B8%A1%EC%9D%84+%EC%9C%84%ED%95%9C+%EC%82%AC%EC%9D%B4%ED%82%B7%EB%9F%B0%EC%9D%98+%EC%A7%80%EB%8F%84+%EA%B8%B0%EA%B3%84+%ED%95%99%EC%8A%B5+%EB%AA%A8%EB%8D%B8+%EC%84%B1%EB%8A%A5+%EB%B9%84%EA%B5%90&rft.jtitle=%EB%94%94%EC%A7%80%ED%84%B8%EC%BD%98%ED%85%90%EC%B8%A0%ED%95%99%ED%9A%8C%EB%85%BC%EB%AC%B8%EC%A7%80&rft.au=%EA%B6%8C%ED%98%9C%EC%A7%84%28Hye-Jin+Kwon%29&rft.au=%ED%95%98%EC%A7%84%EC%98%81%28Jin-Young+Ha%29&rft.date=2023-06-01&rft.pub=%ED%95%9C%EA%B5%AD%EB%94%94%EC%A7%80%ED%84%B8%EC%BD%98%ED%85%90%EC%B8%A0%ED%95%99%ED%9A%8C&rft.issn=1598-2009&rft.eissn=2287-738X&rft.volume=24&rft.issue=6&rft.spage=1305&rft.epage=1315&rft_id=info:doi/10.9728%2Fdcs.2023.24.6.1305&rft.externalDocID=NODE11444901
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1598-2009&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1598-2009&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1598-2009&client=summon