공공 자전거 수요 예측을 위한 사이킷런의 지도 기계 학습 모델 성능 비교
본 연구는 공공 자전거 수요 예측을 위해 사이킷런에서 제공하는 기계 학습 모델들의 성능을 비교 평가를 하였다. 공공에서 제공하고 있는 신뢰성 있는 데이터를 실험에 사용하였는데, 서울시가 제공하는 ‘서울시 공공자전거 이용정보’ 데이터와 기상청이 제공하는 ‘날씨 정보’를 활용하였다. 사이킷런 지도학습의 모델인 랜덤 포레스트, 그래디언트 부스팅, 결정 트리, 선형 회귀를 사용하였고, 성능을 비교 분석하기 위해 RMSE, R2, RMSLE, 정확도를 계산하여 평가 지표로 사용하였다. 그 결과 랜덤 포레스트 모델이 RMSE 347.37, R...
Saved in:
| Published in | 디지털콘텐츠학회논문지 Vol. 24; no. 6; pp. 1305 - 1315 |
|---|---|
| Main Authors | , |
| Format | Journal Article |
| Language | Korean |
| Published |
한국디지털콘텐츠학회
01.06.2023
|
| Subjects | |
| Online Access | Get full text |
| ISSN | 1598-2009 2287-738X |
| DOI | 10.9728/dcs.2023.24.6.1305 |
Cover
| Abstract | 본 연구는 공공 자전거 수요 예측을 위해 사이킷런에서 제공하는 기계 학습 모델들의 성능을 비교 평가를 하였다. 공공에서 제공하고 있는 신뢰성 있는 데이터를 실험에 사용하였는데, 서울시가 제공하는 ‘서울시 공공자전거 이용정보’ 데이터와 기상청이 제공하는 ‘날씨 정보’를 활용하였다. 사이킷런 지도학습의 모델인 랜덤 포레스트, 그래디언트 부스팅, 결정 트리, 선형 회귀를 사용하였고, 성능을 비교 분석하기 위해 RMSE, R2, RMSLE, 정확도를 계산하여 평가 지표로 사용하였다. 그 결과 랜덤 포레스트 모델이 RMSE 347.37, R2 0.74, RMSLE 0.51, 정확도 67.61%로 가장 성능을 보였다. 그래디언트 부스팅과 결정 트리 모델은 랜덤 포레스트보다 다소 낮은 성능을 보였지만, 선형 회귀의 성능은 현저하게 낮음을 확인할 수 있었다. 다양한 모델들을 활용한 수요 예측 분석을 통해 최적의 모델을 선정하여 수요 예측 오차를 줄여 나가는 데 도움이 될 수 있을 것으로 판단한다. This study compares and evaluates the performance of machine learning models provided by scikit-learn for predicting public bicycle demand. Reliable data provided by the government, namely "Seoul public bicycle usage information" provided by the Seoul Metropolitan Government and "weather information" provided by the Korea Meteorological Administration, were used for the experiment. Supervised learning models in scikit-learn, namely random forest, gradient boosting, decision tree, and linear regression, were used, and performance was evaluated using RMSE, R2, RMSLE, and accuracy. The random forest model showed the best performance with an RMSE of 347.37, R2 of 0.74, RMSLE of 0.51, and accuracy of 67.61%. The gradient boosting and decision tree were the next best-performing models, whereas the linear regression had the worst performance, as expected. Thus, from the various models for demand prediction analysis, the optimal model can be selected to reduce demand prediction errors. KCI Citation Count: 0 |
|---|---|
| AbstractList | 본 연구는 공공 자전거 수요 예측을 위해 사이킷런에서 제공하는 기계 학습 모델들의 성능을 비교 평가를 하였다. 공공에서 제공하고 있는 신뢰성 있는 데이터를 실험에 사용하였는데, 서울시가 제공하는 ‘서울시 공공자전거 이용정보’ 데이터와 기상청이 제공하는 ‘날씨 정보’를 활용하였다. 사이킷런 지도학습의 모델인 랜덤 포레스트, 그래디언트 부스팅, 결정 트리, 선형 회귀를 사용하였고, 성능을 비교 분석하기 위해 RMSE, R2, RMSLE, 정확도를 계산하여 평가 지표로 사용하였다. 그 결과 랜덤 포레스트 모델이 RMSE 347.37, R2 0.74, RMSLE 0.51, 정확도 67.61%로 가장 성능을 보였다. 그래디언트 부스팅과 결정 트리 모델은 랜덤 포레스트보다 다소 낮은 성능을 보였지만, 선형 회귀의 성능은 현저하게 낮음을 확인할 수 있었다. 다양한 모델들을 활용한 수요 예측 분석을 통해 최적의 모델을 선정하여 수요 예측 오차를 줄여 나가는 데 도움이 될 수 있을 것으로 판단한다. This study compares and evaluates the performance of machine learning models provided by scikit-learn for predicting public bicycle demand. Reliable data provided by the government, namely "Seoul public bicycle usage information" provided by the Seoul Metropolitan Government and "weather information" provided by the Korea Meteorological Administration, were used for the experiment. Supervised learning models in scikit-learn, namely random forest, gradient boosting, decision tree, and linear regression, were used, and performance was evaluated using RMSE, R2, RMSLE, and accuracy. The random forest model showed the best performance with an RMSE of 347.37, R2 of 0.74, RMSLE of 0.51, and accuracy of 67.61%. The gradient boosting and decision tree were the next best-performing models, whereas the linear regression had the worst performance, as expected. Thus, from the various models for demand prediction analysis, the optimal model can be selected to reduce demand prediction errors. KCI Citation Count: 0 |
| Author | 하진영(Jin-Young Ha) 권혜진(Hye-Jin Kwon) |
| Author_xml | – sequence: 1 fullname: 권혜진(Hye-Jin Kwon) – sequence: 2 fullname: 하진영(Jin-Young Ha) |
| BackLink | https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002973176$$DAccess content in National Research Foundation of Korea (NRF) |
| BookMark | eNotjE1LAkEAhocwyMw_0GkuXYLd5mN3Z_coZiVIQnjotsx-TCzWGisduoXsQYTIQ4KF9nGIIjooJtlf2h3_Q1bCC897eHjWQSZshD4AmxipFiPmjuc2VYIIVYmmGiqmSF8BWUJMpjBqHmdAFuuWqRCErDWQbzYDB-mUMkYIyQInmUwXg_KhK5_iZDyCst2X97dQ9tty9iyHMZSDeN4bQNn6kMPPeesrfRzJYR_K16v0JobJbJRMYjjv3cnOFKbvb-n1DMp4nHZeYPodJ9PuBlgV_LTp55fMgdpeqVY8UCrV_XKxUFFCQ8cK9R1BOGXCwdzwdNMUwhXccRh1KTc4JUiYPhO6sFyiY2JYTFtYlqdxx6C-hmgObP9nw0jYdTewGzz440nDrkd24ahWtjEiBjGtX3lrKV9EwZnvBdw-XxweXdqH1d0SxpqmWQjTH2DahYQ |
| ContentType | Journal Article |
| DBID | DBRKI TDB ACYCR |
| DOI | 10.9728/dcs.2023.24.6.1305 |
| DatabaseName | DBPIA - 디비피아 Nurimedia DBPIA Journals Korean Citation Index |
| DatabaseTitleList | |
| DeliveryMethod | fulltext_linktorsrc |
| DocumentTitleAlternate | Performance Comparison of Scikit-Learn's Supervised Machine Learning Models for Public Bicycle Demand Prediction |
| DocumentTitle_FL | Performance Comparison of Scikit-Learn"s Supervised Machine Learning Models for Public Bicycle Demand Prediction |
| EISSN | 2287-738X |
| EndPage | 1315 |
| ExternalDocumentID | oai_kci_go_kr_ARTI_10262890 NODE11444901 |
| GroupedDBID | ALMA_UNASSIGNED_HOLDINGS DBRKI M~E TDB ACYCR |
| ID | FETCH-LOGICAL-n651-3ebf2a37fb1a6d588ffcfabb73c3a6a320f8e7f5f9c25126974d589d4ab63e403 |
| ISSN | 1598-2009 |
| IngestDate | Wed Apr 23 03:12:09 EDT 2025 Thu Feb 06 13:29:55 EST 2025 |
| IsPeerReviewed | true |
| IsScholarly | true |
| Issue | 6 |
| Keywords | 데이터 분석 공공자전거 수요 예측 파이썬 Demand Prediction Public Bicycles Data Analysis 기계 학습 사이킷런 Machine Learning Scikit-Learn Python |
| Language | Korean |
| LinkModel | OpenURL |
| MergedId | FETCHMERGED-LOGICAL-n651-3ebf2a37fb1a6d588ffcfabb73c3a6a320f8e7f5f9c25126974d589d4ab63e403 |
| Notes | http://dx.doi.org/10.9728/dcs.2023.24.6.1305 |
| PageCount | 11 |
| ParticipantIDs | nrf_kci_oai_kci_go_kr_ARTI_10262890 nurimedia_primary_NODE11444901 |
| PublicationCentury | 2000 |
| PublicationDate | 2023-06 |
| PublicationDateYYYYMMDD | 2023-06-01 |
| PublicationDate_xml | – month: 06 year: 2023 text: 2023-06 |
| PublicationDecade | 2020 |
| PublicationTitle | 디지털콘텐츠학회논문지 |
| PublicationYear | 2023 |
| Publisher | 한국디지털콘텐츠학회 |
| Publisher_xml | – name: 한국디지털콘텐츠학회 |
| SSID | ssib053377222 ssib008451574 ssib049971524 ssib036278589 ssib053682487 |
| Score | 2.234907 |
| Snippet | 본 연구는 공공 자전거 수요 예측을 위해 사이킷런에서 제공하는 기계 학습 모델들의 성능을 비교 평가를 하였다. 공공에서 제공하고 있는 신뢰성 있는 데이터를 실험에... |
| SourceID | nrf nurimedia |
| SourceType | Open Website Publisher |
| StartPage | 1305 |
| SubjectTerms | 컴퓨터학 |
| Title | 공공 자전거 수요 예측을 위한 사이킷런의 지도 기계 학습 모델 성능 비교 |
| URI | https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11444901 https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002973176 |
| Volume | 24 |
| hasFullText | 1 |
| inHoldings | 1 |
| isFullTextHit | |
| isPrint | |
| ispartofPNX | 디지털콘텐츠학회논문지, 2023, 24(6), , pp.1305-1315 |
| journalDatabaseRights | – providerCode: PRVHPJ databaseName: ROAD: Directory of Open Access Scholarly Resources customDbUrl: eissn: 2287-738X dateEnd: 99991231 omitProxy: true ssIdentifier: ssib053682487 issn: 1598-2009 databaseCode: M~E dateStart: 20000101 isFulltext: true titleUrlDefault: https://road.issn.org providerName: ISSN International Centre |
| link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrR1Na9VAMNR60IsoKtaPEtA9lTzzkk2ye8xXeVaslyf0FpJ9iZTCq5QW0YNIyaEUxB4sVGn9OIgiHlpqsf4Vf8J76X9wdjcviR_gB0LIW2ZmZ2dnMrszj_1QlGuM9JhDdXCkOMEaThymEQtnmpGBW1KI8VkiVvnO2p07eGbOmhs79rWxamllOWmxh7_cV_IvVgUY2JXvkv0Ly1ZMAQBlsC-8wcLw_iMbo9BFnok8qypModBHNERU5wVXRwQLXBt5usARgigRRC6iWJITDoWCR5DbFpAA6kmcLzgEiFpQlhwM5PollSdwAPEcFHqITkMzJYoSQe06fC0F4Mi05OnyZjiVkFiAJHcqmLuyEx5yXeQSURGakbxAEugIBwFOUnl01EPgoDcjbSEP5k8tRSBYyL4GQg8AsUpl8d7rDWECriLii_Ys5ImC65fVBcPRxyratwWt4Er9EQmG-L3zINVm5vtTN-_zKJvWlWRLpKYtbQFzC4EKmhiIpzrxqFL534xh1mvIhDdV5in14Ab_q-_NGYsKp5CSpAJmQBqsOaa4s7ma5uRW9dKdm3MWRDFWI_5pm3J_7Y9zK3UMvl-kx_gh94bZMnDLbtV1vzuzfPZ2EEKijTHlWyuPGzDj8mtVbj0Kq7GeYIik69QD4iiHWPXNB5CIOxBaVnjISiAPrI-atEybGFjcf1lpQO6J43Je_1lKiB37SxBynuiv8HszYPBtxJHd08qpMgFUXenNZ5SxhcWzSjLYP4BHLV5uFK_zwd6uWqxtFS-eqcXWWnH4ptjJ1WI7P9rcVovVj8XOp6PVz8NXu8XOllq8ezx8mquDw93Bfq4ebT4v1g_U4Yf3wyeHapHvDdffqsMv-eBg45zSnQ67fkcrbz_R-rbV1sw0yYzYdLKkHds9i5AsY1mcJI7JzNiOTUPPSOpkVkYZT1Fs6mCgoj0cJ7aZYt08r4z3F_vpBUW1Y8ZowjLSBq3HthODIjMcW8A-dRgjE8pVUE20wOYjftg8_727GC0sRZBS34ggA7H5aoQJZbJSXXRPHoUTNQ198XcEl5STtZNcVsaXl1bSKxDSLyeT4tv4BvGMxOA |
| linkProvider | ISSN International Centre |
| openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%EA%B3%B5%EA%B3%B5+%EC%9E%90%EC%A0%84%EA%B1%B0+%EC%88%98%EC%9A%94+%EC%98%88%EC%B8%A1%EC%9D%84+%EC%9C%84%ED%95%9C+%EC%82%AC%EC%9D%B4%ED%82%B7%EB%9F%B0%EC%9D%98+%EC%A7%80%EB%8F%84+%EA%B8%B0%EA%B3%84+%ED%95%99%EC%8A%B5+%EB%AA%A8%EB%8D%B8+%EC%84%B1%EB%8A%A5+%EB%B9%84%EA%B5%90&rft.jtitle=%EB%94%94%EC%A7%80%ED%84%B8%EC%BD%98%ED%85%90%EC%B8%A0%ED%95%99%ED%9A%8C%EB%85%BC%EB%AC%B8%EC%A7%80&rft.au=%EA%B6%8C%ED%98%9C%EC%A7%84%28Hye-Jin+Kwon%29&rft.au=%ED%95%98%EC%A7%84%EC%98%81%28Jin-Young+Ha%29&rft.date=2023-06-01&rft.pub=%ED%95%9C%EA%B5%AD%EB%94%94%EC%A7%80%ED%84%B8%EC%BD%98%ED%85%90%EC%B8%A0%ED%95%99%ED%9A%8C&rft.issn=1598-2009&rft.eissn=2287-738X&rft.volume=24&rft.issue=6&rft.spage=1305&rft.epage=1315&rft_id=info:doi/10.9728%2Fdcs.2023.24.6.1305&rft.externalDocID=NODE11444901 |
| thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1598-2009&client=summon |
| thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1598-2009&client=summon |
| thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1598-2009&client=summon |