계산과학공학 플랫폼을 위한 실행-이력 기반의 시뮬레이션데이터 관리 프레임워크 설계 및 구현

지난 수년간 KISTI는 EDISON이라는 온라인 시뮬레이션 실행 플랫폼을 통해 사용자들이 다양한 계산과학공학 분야에서 제공된 사이언스 애플리케이션에 대한 시뮬레이션을 수행할 수 있는 서비스를 제공하고 있다. 일반적으로 이러한 시뮬레이션은 대규모 계산을수반하므로 대용량의 출력 데이터를 생산해 낸다. 온라인 플랫폼에서 이러한 시뮬레이션을 수행 할 때 발생하는 중요한 문제 중 하나는 많은 사용자가 동일한 (또는 거의 변하지 않는) 입력 매개 변수 또는 파일을 사용하여 시뮬레이션 요청 (또는 작업)을 플랫폼에동시에 제출함으로써 플랫폼에...

Full description

Saved in:
Bibliographic Details
Published inInteonet jeongbo hakoe nonmunji = Journal of Korean Society for Internet Information pp. 77 - 86
Main Authors 마진, 이식, 조금원, 서영균
Format Journal Article
LanguageKorean
Published 한국인터넷정보학회 01.02.2018
Subjects
Online AccessGet full text
ISSN1598-0170
DOI10.7472/jksii.2018.19.1.77

Cover

Abstract 지난 수년간 KISTI는 EDISON이라는 온라인 시뮬레이션 실행 플랫폼을 통해 사용자들이 다양한 계산과학공학 분야에서 제공된 사이언스 애플리케이션에 대한 시뮬레이션을 수행할 수 있는 서비스를 제공하고 있다. 일반적으로 이러한 시뮬레이션은 대규모 계산을수반하므로 대용량의 출력 데이터를 생산해 낸다. 온라인 플랫폼에서 이러한 시뮬레이션을 수행 할 때 발생하는 중요한 문제 중 하나는 많은 사용자가 동일한 (또는 거의 변하지 않는) 입력 매개 변수 또는 파일을 사용하여 시뮬레이션 요청 (또는 작업)을 플랫폼에동시에 제출함으로써 플랫폼에 상당한 부담을 준다는 점이다. 다시 말해, 동일한 컴퓨팅 작업으로 인해 중복 컴퓨팅 및 스토리지 리소스가 빠른 속도로 소모된다는 점이다. 이와 같은 동일한 시뮬레이션 요청으로 인한 과도한 자원 사용 문제를 극복하기 위해, 본논문은 실행 메타 데이터, 즉 프로비넌스를 기반으로 시뮬레이션 데이터를 효율적으로 관리하기 위한 IceSheet라는 새로운 프레임워크를 제안한다. IceSheet 프레임워크는 시뮬레이션 실행과 관련된 프로비넌스를 수집하여 저장한다. 수집된 프로비넌스 정보는 중복 시뮬레이션 요청을 제외할 뿐만 아니라 오픈소스 검색 엔진인 ElasticSearch를 통해 기존 시뮬레이션 결과를 검색하는 데도 사용된다. 특히 본 논문은 IceSheet 프레임워크에서 저장된 시뮬레이션 결과를 검색하고 재사용할 수 있는 핵심 구성 요소에 대해 자세히설명한다. 우리는 온라인 시뮬레이션 실행 플랫폼과 함께 연동하는 검색 엔진을 기반으로 제안된 프레임워크의 프로토타입을 구현하였다. 플랫폼에서 수집된 실제 시뮬레이션 실행 프로비넌스를 기반으로 제안된 프레임워크의 성능 평가를 수행하였다. 플랫폼과 완벽히 연동된 IceSheet 프레임워크는 사용자로 하여금 선택된 시뮬레이션 소프트웨어에 대해 과거에 입력된 매개 변수 값을 빠르게검색하고 동일한 입력 매개 변수 값이 존재하는 경우 기존의 결과를 곧바로 반환할 수 있도록 할 것으로 기대된다. 따라서 제안된프레임워크를 통해 이전에 실행된 시뮬레이션과 동일한 요청에 대해 중복 자원 소모를 없애고 실행 시간을 크게 단축시키는 데 도움이 될 것으로 기대한다. For the past few years, KISTI has been servicing an online simulation execution platform, called EDISON, allowing users to conduct simulations on various scientific applications supplied by diverse computational science and engineering disciplines. Typically, these simulations accompany large-scale computation and accordingly produce a huge volume of output data. One critical issue arising when conducting those simulations on an online platform stems from the fact that a number of users simultaneously submit to the platform their simulation requests (or jobs) with the same (or almost unchanging) input parameters or files, resulting in charging a significant burden on the platform. In other words, the same computing jobs lead to duplicate consumption computing and storage resources at an undesirably fast pace. To overcome excessive resource usage by such identical simulation requests, in this paper we introduce a novel framework, called IceSheet, to efficiently manage simulation data based on execution metadata, that is, provenance. The IceSheet framework captures and stores each provenance associated with a conducted simulation. The collected provenance records are utilized for not only inspecting duplicate simulation requests but also performing search on existing simulation results via an open-source search engine, ElasticSearch. In particular, this paper elaborates on the core components in the IceSheet framework to support the search and reuse on the stored simulation results. We implemented as prototype the proposed framework using the engine in conjunction with the online simulation execution platform. Our evaluation of the framework was performed on the real simulation execution-provenance records collected on the platform. Once the prototyped IceSheet framework fully functions with the platform, users can quickly search for past parameter values entered into desired simulation software and receive existing results on the same input parameter values on the software if any. Therefore, we expect that the proposed framework contributes to eliminating duplicate resource consumption and significantly reducing execution time on the same requests as previously-executed simulations. KCI Citation Count: 1
AbstractList 지난 수년간 KISTI는 EDISON이라는 온라인 시뮬레이션 실행 플랫폼을 통해 사용자들이 다양한 계산과학공학 분야에서 제공된 사이언스 애플리케이션에 대한 시뮬레이션을 수행할 수 있는 서비스를 제공하고 있다. 일반적으로 이러한 시뮬레이션은 대규모 계산을수반하므로 대용량의 출력 데이터를 생산해 낸다. 온라인 플랫폼에서 이러한 시뮬레이션을 수행 할 때 발생하는 중요한 문제 중 하나는 많은 사용자가 동일한 (또는 거의 변하지 않는) 입력 매개 변수 또는 파일을 사용하여 시뮬레이션 요청 (또는 작업)을 플랫폼에동시에 제출함으로써 플랫폼에 상당한 부담을 준다는 점이다. 다시 말해, 동일한 컴퓨팅 작업으로 인해 중복 컴퓨팅 및 스토리지 리소스가 빠른 속도로 소모된다는 점이다. 이와 같은 동일한 시뮬레이션 요청으로 인한 과도한 자원 사용 문제를 극복하기 위해, 본논문은 실행 메타 데이터, 즉 프로비넌스를 기반으로 시뮬레이션 데이터를 효율적으로 관리하기 위한 IceSheet라는 새로운 프레임워크를 제안한다. IceSheet 프레임워크는 시뮬레이션 실행과 관련된 프로비넌스를 수집하여 저장한다. 수집된 프로비넌스 정보는 중복 시뮬레이션 요청을 제외할 뿐만 아니라 오픈소스 검색 엔진인 ElasticSearch를 통해 기존 시뮬레이션 결과를 검색하는 데도 사용된다. 특히 본 논문은 IceSheet 프레임워크에서 저장된 시뮬레이션 결과를 검색하고 재사용할 수 있는 핵심 구성 요소에 대해 자세히설명한다. 우리는 온라인 시뮬레이션 실행 플랫폼과 함께 연동하는 검색 엔진을 기반으로 제안된 프레임워크의 프로토타입을 구현하였다. 플랫폼에서 수집된 실제 시뮬레이션 실행 프로비넌스를 기반으로 제안된 프레임워크의 성능 평가를 수행하였다. 플랫폼과 완벽히 연동된 IceSheet 프레임워크는 사용자로 하여금 선택된 시뮬레이션 소프트웨어에 대해 과거에 입력된 매개 변수 값을 빠르게검색하고 동일한 입력 매개 변수 값이 존재하는 경우 기존의 결과를 곧바로 반환할 수 있도록 할 것으로 기대된다. 따라서 제안된프레임워크를 통해 이전에 실행된 시뮬레이션과 동일한 요청에 대해 중복 자원 소모를 없애고 실행 시간을 크게 단축시키는 데 도움이 될 것으로 기대한다. For the past few years, KISTI has been servicing an online simulation execution platform, called EDISON, allowing users to conduct simulations on various scientific applications supplied by diverse computational science and engineering disciplines. Typically, these simulations accompany large-scale computation and accordingly produce a huge volume of output data. One critical issue arising when conducting those simulations on an online platform stems from the fact that a number of users simultaneously submit to the platform their simulation requests (or jobs) with the same (or almost unchanging) input parameters or files, resulting in charging a significant burden on the platform. In other words, the same computing jobs lead to duplicate consumption computing and storage resources at an undesirably fast pace. To overcome excessive resource usage by such identical simulation requests, in this paper we introduce a novel framework, called IceSheet, to efficiently manage simulation data based on execution metadata, that is, provenance. The IceSheet framework captures and stores each provenance associated with a conducted simulation. The collected provenance records are utilized for not only inspecting duplicate simulation requests but also performing search on existing simulation results via an open-source search engine, ElasticSearch. In particular, this paper elaborates on the core components in the IceSheet framework to support the search and reuse on the stored simulation results. We implemented as prototype the proposed framework using the engine in conjunction with the online simulation execution platform. Our evaluation of the framework was performed on the real simulation execution-provenance records collected on the platform. Once the prototyped IceSheet framework fully functions with the platform, users can quickly search for past parameter values entered into desired simulation software and receive existing results on the same input parameter values on the software if any. Therefore, we expect that the proposed framework contributes to eliminating duplicate resource consumption and significantly reducing execution time on the same requests as previously-executed simulations. KCI Citation Count: 1
Author 이식
서영균
마진
조금원
Author_xml – sequence: 1
  fullname: 마진
  organization: (한국과학기술정보연구원)
– sequence: 2
  fullname: 이식
  organization: (한국과학기술정보연구원)
– sequence: 3
  fullname: 조금원
  organization: (한국과학기술정보연구원)
– sequence: 4
  fullname: 서영균
  organization: (경북대학교)
BackLink https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002320361$$DAccess content in National Research Foundation of Korea (NRF)
BookMark eNqVTctKAzEAzKGCVfsDnnL1sDFpLOkeRRS9Su-hSitxZRe6P1AlgmKlFysr7pYeqhcXCWwLHvpFefyDUfwBLzPDzDCzAWpxEvcA2CYYsT3W3L2MUiFQE5M2IiEiiLEaqJNW2A4wYXgdNNJUnOEWpYzRENfBUFfS3ihdrdzkRVdLj9A9jcz0w41XtpDQ5tJNcmgf5u75PrDFwszeoP5SRmW2yLyfm8_SzO58Ym8z86i8cFJBvRia99JvyZ9wKu3ryF2X0Mq5f4RGjaFeli6TW2Ct371Ke40_3gQ7R4edg-MgHvR5dC540hW_fJHwaMD3TzsnnIaUYYLpf7rfTl6C8g
ContentType Journal Article
DBID ACYCR
DOI 10.7472/jksii.2018.19.1.77
DatabaseName Korean Citation Index
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
Discipline Engineering
DocumentTitleAlternate Design and Implementation of an Execution-Provenance Based Simulation Data Management Framework for Computational Science Engineering Simulation Platform
EndPage 86
ExternalDocumentID oai_kci_go_kr_ARTI_3937010
GroupedDBID .4S
ACYCR
AEMOZ
AHQJS
AKVCP
ALMA_UNASSIGNED_HOLDINGS
ARCSS
EBA
EBE
EBR
EBU
EDO
EPL
TH9
TUS
ID FETCH-nrf_kci_oai_kci_go_kr_ARTI_39370103
ISSN 1598-0170
IngestDate Sun Mar 09 07:50:27 EDT 2025
IsPeerReviewed false
IsScholarly true
Language Korean
LinkModel OpenURL
MergedId FETCHMERGED-nrf_kci_oai_kci_go_kr_ARTI_39370103
Notes http://www.jics.or.kr/digital-library/3211
ParticipantIDs nrf_kci_oai_kci_go_kr_ARTI_3937010
PublicationCentury 2000
PublicationDate 2018-02
PublicationDateYYYYMMDD 2018-02-01
PublicationDate_xml – month: 02
  year: 2018
  text: 2018-02
PublicationDecade 2010
PublicationTitle Inteonet jeongbo hakoe nonmunji = Journal of Korean Society for Internet Information
PublicationYear 2018
Publisher 한국인터넷정보학회
Publisher_xml – name: 한국인터넷정보학회
SSID ssib053377390
ssib001195163
ssib018233818
ssib036278810
ssib053835315
ssj0001908993
Score 4.0619454
Snippet 지난 수년간 KISTI는 EDISON이라는 온라인 시뮬레이션 실행 플랫폼을 통해 사용자들이 다양한 계산과학공학 분야에서 제공된 사이언스 애플리케이션에 대한 시뮬레이션을...
SourceID nrf
SourceType Open Website
StartPage 77
SubjectTerms 컴퓨터학
Title 계산과학공학 플랫폼을 위한 실행-이력 기반의 시뮬레이션데이터 관리 프레임워크 설계 및 구현
URI https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002320361
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX 인터넷정보학회논문지, 2018, 19(1), , pp.77-86
journalDatabaseRights – providerCode: PRVEBS
  databaseName: Business Source Ultimate
  issn: 1598-0170
  databaseCode: AKVCP
  dateStart: 20141201
  customDbUrl:
  isFulltext: true
  dateEnd: 99991231
  titleUrlDefault: https://search.ebscohost.com/login.aspx?authtype=ip,uid&profile=ehost&defaultdb=bsu
  omitProxy: true
  ssIdentifier: ssj0001908993
  providerName: EBSCOhost
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR1Nb9MwNJq6CxwQn-JbAeEDilLaxknsY5J2GkwgDgPtViUlHV1FI5XuwmmgIIEY2oWhIrZph8GFClXaJnHYL2qS_8Cz47QZDDG4uM7z8_P7cOr3HH9I0i2viWGY0yuq5hNPxW7FVD0X6yp1IRwiBtW9JgsU7z8wZh_hewv6wlThRm7V0nLPKzZeHLmv5H-sCjCwK9sl-w-WHRMFAOTBvpCChSE9lo1RzUK2hghGNQeRCrJLAmI7qFZFVEeUZhB9DFF4DnxIQLIRrSHLZhAyw6s5iEIeKzzncNppPYeDiI2sFGQgQlWBb2NGyiohS1d4g4TzYrOUEoFESUaB8pYtaNkR9QjJUQIcnVezEalyQuMixhpA0kYwW6bB6htAaCwVPkyyJtRDbS4wECin2Fw2JovQoSL4JTMpdZ1zx9hG6fVymQ_PJlGDjt9TluBn0QuUp2478JVO0Hm23FlqKUirKjk_fy7osq8d-eWx6TQsUBCbwfKLITj3puCeZfCkJK8h0GI1X2KVM_OTTHRAKeVRQF6aWpgwLTBcEzSVn_gpk2ytuHhVx9bPdFLN2CBja3BDYUaM8VFi-EyVmrCY6IaQscAE-VGQ7bsspze6iJFNXLYjfCTjqNEXIlN2mu9S-3mrxRZNkmKZFsvFrGb-qPNfXJBDh523G636YlBvd-sQ0t2tsxMb-SbK6YppGJWCNG3NPXYeTnz-MgQJkzPkIF7WmBeaPYODxm5MGA9KEN6YpkZzzxCDaMIn5hOz_Es435iTqSHdbMfEu_O7cOCUdrrNnFM6f1o6JXqZbKV_DWekqXZwVjqZO2P0nLQy2g3jV8PR7kGy_mm0uw-pnHxYjba-JWsH8WYoxxthsr4hx-92ko9v1XhzL9r-Io9-DKNhP97sA3wj-j6Itt9ASfy6H70fQiYJh_JobyX6OgBaISvcCuPPq8nLgRyHO9CiHA3X5NH-IOmH56XbM7V5Z1YF_rnW_6x97YJUgNfIvyjJT7Sm3_AM3NQbBGPXJNR03UbFdH1f00oeviTd_Du9y8dBuiKdmPT7q1Kh1132r0EI0POui07wEzc16RQ
linkProvider EBSCOhost
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%EA%B3%84%EC%82%B0%EA%B3%BC%ED%95%99%EA%B3%B5%ED%95%99+%ED%94%8C%EB%9E%AB%ED%8F%BC%EC%9D%84+%EC%9C%84%ED%95%9C+%EC%8B%A4%ED%96%89-%EC%9D%B4%EB%A0%A5+%EA%B8%B0%EB%B0%98%EC%9D%98+%EC%8B%9C%EB%AE%AC%EB%A0%88%EC%9D%B4%EC%85%98%EB%8D%B0%EC%9D%B4%ED%84%B0+%EA%B4%80%EB%A6%AC+%ED%94%84%EB%A0%88%EC%9E%84%EC%9B%8C%ED%81%AC+%EC%84%A4%EA%B3%84+%EB%B0%8F+%EA%B5%AC%ED%98%84&rft.jtitle=Inteonet+jeongbo+hakoe+nonmunji+%3D+Journal+of+Korean+Society+for+Internet+Information&rft.au=%EB%A7%88%EC%A7%84&rft.au=%EC%9D%B4%EC%8B%9D&rft.au=%EC%A1%B0%EA%B8%88%EC%9B%90&rft.au=%EC%84%9C%EC%98%81%EA%B7%A0&rft.date=2018-02-01&rft.pub=%ED%95%9C%EA%B5%AD%EC%9D%B8%ED%84%B0%EB%84%B7%EC%A0%95%EB%B3%B4%ED%95%99%ED%9A%8C&rft.issn=1598-0170&rft.spage=77&rft.epage=86&rft_id=info:doi/10.7472%2Fjksii.2018.19.1.77&rft.externalDBID=n%2Fa&rft.externalDocID=oai_kci_go_kr_ARTI_3937010
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1598-0170&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1598-0170&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1598-0170&client=summon