GPU 하드웨어 아키텍처 기반 sub-warp 단위 병렬 프리픽스(prefix) 연산의 정확한 구현
본 논문에서는 대규모 데이터를 길이가 32 미만인 로컬 세그먼트 단위로 구분하고 이 로컬 세그먼트 내에서 정확한 GPU 병렬 프리픽스(prefix) 연산 결과를 출력하는 CUDA (Compute Unified Device Architecture) 코드를 제시한다. 이미 Mark Harris와 Michael Garland가 이러한 목적을 수행하기 위한 CUDA 코드를 이미 발표한 바 있으나 본 논문에서는 로컬 세그먼트의 길이가 32 미만일 때 기존 코드의 결과가 정확하지 않다는 사실을 살펴 보고 그 원인을 논의한 후, 정확한 결과를...
Saved in:
| Published in | 디지털콘텐츠학회논문지 Vol. 18; no. 3; pp. 613 - 619 |
|---|---|
| Main Author | |
| Format | Journal Article |
| Language | Korean |
| Published |
한국디지털콘텐츠학회
2017
|
| Subjects | |
| Online Access | Get full text |
| ISSN | 1598-2009 2287-738X |
| DOI | 10.9728/dcs.2017.18.3.613 |
Cover
| Abstract | 본 논문에서는 대규모 데이터를 길이가 32 미만인 로컬 세그먼트 단위로 구분하고 이 로컬 세그먼트 내에서 정확한 GPU 병렬 프리픽스(prefix) 연산 결과를 출력하는 CUDA (Compute Unified Device Architecture) 코드를 제시한다. 이미 Mark Harris와 Michael Garland가 이러한 목적을 수행하기 위한 CUDA 코드를 이미 발표한 바 있으나 본 논문에서는 로컬 세그먼트의 길이가 32 미만일 때 기존 코드의 결과가 정확하지 않다는 사실을 살펴 보고 그 원인을 논의한 후, 정확한 결과를 출력하는 코드를 제안한다. 본 논문에서 다루는 로컬 세그먼트 단위의 병렬 프리픽스 연산은 최인접 요소 탐색(k-nearest neighbor search) 등은 물론 다양한 대규모 병렬 처리 알고리즘을 구성하는 기본 연산으로 활용 가능하다. This paper presents a CUDA (Compute Unified Device Architecture) code to achieve correct GPU parallel segmented prefix operation results with less than 32 segment length for large data arrays. Mark Harris and Michael Garland had published CUDA code to address the tasks. This paper shows that their code does not generate correct results when the local segment length is less than 32, discusses the cause of the problem, and presents a CUDA code that generates correct results. The segmented parallel prefix operation presented in this paper can be applied as a building block to various large parallel processing algorithms including the k-nearest neighbor search problems. KCI Citation Count: 1 |
|---|---|
| AbstractList | 본 논문에서는 대규모 데이터를 길이가 32 미만인 로컬 세그먼트 단위로 구분하고 이 로컬 세그먼트 내에서 정확한 GPU 병렬 프리픽스(prefix) 연산 결과를 출력하는 CUDA (Compute Unified Device Architecture) 코드를 제시한다. 이미 Mark Harris와 Michael Garland가 이러한 목적을 수행하기 위한 CUDA 코드를 이미 발표한 바 있으나 본 논문에서는 로컬 세그먼트의 길이가 32 미만일 때 기존 코드의 결과가 정확하지 않다는 사실을 살펴 보고 그 원인을 논의한 후, 정확한 결과를 출력하는 코드를 제안한다. 본 논문에서 다루는 로컬 세그먼트 단위의 병렬 프리픽스 연산은 최인접 요소 탐색(k-nearest neighbor search) 등은 물론 다양한 대규모 병렬 처리 알고리즘을 구성하는 기본 연산으로 활용 가능하다. This paper presents a CUDA (Compute Unified Device Architecture) code to achieve correct GPU parallel segmented prefix operation results with less than 32 segment length for large data arrays. Mark Harris and Michael Garland had published CUDA code to address the tasks. This paper shows that their code does not generate correct results when the local segment length is less than 32, discusses the cause of the problem, and presents a CUDA code that generates correct results. The segmented parallel prefix operation presented in this paper can be applied as a building block to various large parallel processing algorithms including the k-nearest neighbor search problems. KCI Citation Count: 1 |
| Author | 박태정(Taejung Park) |
| Author_xml | – sequence: 1 fullname: 박태정(Taejung Park) |
| BackLink | https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002237955$$DAccess content in National Research Foundation of Korea (NRF) |
| BookMark | eNotkD1Lw0AAhg9RsGp_gNstgg6JubukdzeK1g8oVqSCW7gmdxKqbUkQdZW6KA5ioxErdCjSoUPxA1z8Q83lP1i10_MOD8_wzoHpeqMuAVhElskpZqu-F5nYQtREzCRmAZEpkMOYUYMSdjgNcsjhzMCWxWdBPoqCquUQQinGOAdqW3sHMIuT9L6jn_v64QPquJVd9rKrW_2WwNHXMB0mMDqtGmcibML0pq87LZi-36XdAczarfR1kLW_9XVvuRlKFZyvQP041JdD_ZJA3Y2zpziLO3D0OciS1gKYUeI4kvkJ50Fls1hZ3zZK5a2d9bWSUeM2MxxFpUSEethypF9lRAllFyRWiiEP-9gWNhWc-gUluWdxxJn0qE99ZFepcBgj82DlP1sPlVvzArchgj8eNdxa6K7tV3ZcRDgu2PbYXZq4p2FwIv1AuM3xEOGFu1veKFq_JyGbkR8bTIVG |
| ContentType | Journal Article |
| DBID | DBRKI TDB ACYCR |
| DOI | 10.9728/dcs.2017.18.3.613 |
| DatabaseName | DBPIA - 디비피아 Nurimedia DBPIA Journals Korean Citation Index |
| DatabaseTitleList | |
| DeliveryMethod | fulltext_linktorsrc |
| DocumentTitleAlternate | Correct Implementation of Sub-warp Parallel Prefix Operations based on GPU Hardware Architecture |
| DocumentTitle_FL | Correct Implementation of Sub-warp Parallel Prefix Operations based on GPU Hardware Architecture |
| EISSN | 2287-738X |
| EndPage | 619 |
| ExternalDocumentID | oai_kci_go_kr_ARTI_1392644 NODE07222148 |
| GroupedDBID | ALMA_UNASSIGNED_HOLDINGS DBRKI M~E TDB ACYCR |
| ID | FETCH-LOGICAL-k948-5f7ee137c205edb83faf46e2ff81c2d24a47a97d6fe9c09198ec7d7d14b7a5883 |
| ISSN | 1598-2009 |
| IngestDate | Wed Apr 23 03:12:22 EDT 2025 Thu Feb 06 13:21:58 EST 2025 |
| IsDoiOpenAccess | false |
| IsOpenAccess | true |
| IsPeerReviewed | true |
| IsScholarly | true |
| Issue | 3 |
| Keywords | CUDA Segmented exclusive scan Parallel prefix operation 세그먼트 적용 익스클루시브 스캔 병렬 프리픽스 연산 GPGPU |
| Language | Korean |
| LinkModel | OpenURL |
| MergedId | FETCHMERGED-LOGICAL-k948-5f7ee137c205edb83faf46e2ff81c2d24a47a97d6fe9c09198ec7d7d14b7a5883 |
| Notes | http://dx.doi.org/10.9728/dcs.2017.18.3.613 |
| OpenAccessLink | http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201720636501238&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01 |
| PageCount | 7 |
| ParticipantIDs | nrf_kci_oai_kci_go_kr_ARTI_1392644 nurimedia_primary_NODE07222148 |
| PublicationCentury | 2000 |
| PublicationDate | 2017 |
| PublicationDateYYYYMMDD | 2017-01-01 |
| PublicationDate_xml | – year: 2017 text: 2017 |
| PublicationDecade | 2010 |
| PublicationTitle | 디지털콘텐츠학회논문지 |
| PublicationYear | 2017 |
| Publisher | 한국디지털콘텐츠학회 |
| Publisher_xml | – name: 한국디지털콘텐츠학회 |
| SSID | ssib053377222 ssib008451574 ssib049971524 ssib036278589 ssib053682487 |
| Score | 1.9869726 |
| Snippet | 본 논문에서는 대규모 데이터를 길이가 32 미만인 로컬 세그먼트 단위로 구분하고 이 로컬 세그먼트 내에서 정확한 GPU 병렬 프리픽스(prefix) 연산 결과를 출력하는 CUDA... |
| SourceID | nrf nurimedia |
| SourceType | Open Website Publisher |
| StartPage | 613 |
| SubjectTerms | 컴퓨터학 |
| Title | GPU 하드웨어 아키텍처 기반 sub-warp 단위 병렬 프리픽스(prefix) 연산의 정확한 구현 |
| URI | https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE07222148 https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002237955 |
| Volume | 18 |
| hasFullText | 1 |
| inHoldings | 1 |
| isFullTextHit | |
| isPrint | |
| ispartofPNX | 디지털콘텐츠학회논문지, 2017, 18(3), , pp.613-619 |
| journalDatabaseRights | – providerCode: PRVHPJ databaseName: ROAD: Directory of Open Access Scholarly Resources customDbUrl: eissn: 2287-738X dateEnd: 99991231 omitProxy: true ssIdentifier: ssib053682487 issn: 1598-2009 databaseCode: M~E dateStart: 20000101 isFulltext: true titleUrlDefault: https://road.issn.org providerName: ISSN International Centre |
| link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrR1Na9RANLT1oBdRVKwfJYgDSsmaj0lm5phkV6tg9dBCb8smmUhZ2Ja1i-LBQ1kvigexqyu20EORHnpY_AAv_qFu8h98M7NJ16pQixCGx0vmzXvzZvLeG2bmadp1h0RgSD1uJC43DXGlucHALhg4BeOYRp4ZN8Rp5Pvz3twivrfkLk1Mbo3tWuqsRZX42R_PlRxHq4ADvYpTsv-g2ZIoIAAG_UIJGobySDq-83BxFtWqiLmIUVQLEHMQC1EtRCxAPpWAhwI8KyEXUSy-pjbyFQCYqngV2FAfPvJRQFFgCkpQAupxJzKeNNqrswJFS5ohUJKoANqzBOCbyA8VL1g2AygPUCNMIJuhvmhY7jxJl5_K9QhBjcgmQ8GXAlhVsRMKssC2oMEKAEQNFatuQZ8ilf-tcLJlT2DxCBJEbOYQ0mIhnZBWVlHyM9kg4H2zoM4k4CMaSqFdFEjAD0fVFUEYmRYFWcYXqot-k4zSQhVShvHFFXWKVE6EUqJCoOr_4n3c2DA5nhWbXOJsiGAN4sh0y4VR8dRp3ZF_4ikTc9j0MWKL4xxJLO6gt0jFohWnUtYcv2b8kPn_5aLxZrxcf7RSb7brEE7drUN4IBzmSe2ELZa7xM7Y57Xyd00xOMMH0QO4QoS6B8kLIJYm4B2W7yGwgFDu4LZI1_GojWUKy7In1L4DIcut3yQB76_VBqfxZKsjMl_A73PME1w4o50ehXC6r-bjWW2iuXJOa8Jc1PNef_h2M_u4m737qme9br6-k794nX3u6_vfB8NBXy_mkz58tZttdvXhlzfD7T093-gOP-3lGz-ylzs31Oy4qWfvB9n6INvq69l2L__Qy3ub-v63vbzfPa8t3K4thHPGKJGJ0WSYGm5KOLccEtumy5OIOmkjxR6305RasZ3YuIFJg5HESzmLwX9nlMckIYmFI9JwKXUuaFOtlRa_qOkOT0XKV-4mDYajiEZezCBG5qYdxTjGdFq7Bn0k1fh3dU5rM2UX1lfVpTb1-QfVminUY2F66ShULmunhHrUcuQVbWqt3eFXwUFfi2bkMPkJ7pG6Aw |
| linkProvider | ISSN International Centre |
| openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=GPU+%ED%95%98%EB%93%9C%EC%9B%A8%EC%96%B4+%EC%95%84%ED%82%A4%ED%85%8D%EC%B2%98+%EA%B8%B0%EB%B0%98+sub-warp+%EB%8B%A8%EC%9C%84+%EB%B3%91%EB%A0%AC+%ED%94%84%EB%A6%AC%ED%94%BD%EC%8A%A4%28prefix%29+%EC%97%B0%EC%82%B0%EC%9D%98+%EC%A0%95%ED%99%95%ED%95%9C+%EA%B5%AC%ED%98%84&rft.jtitle=%EB%94%94%EC%A7%80%ED%84%B8%EC%BD%98%ED%85%90%EC%B8%A0%ED%95%99%ED%9A%8C%EB%85%BC%EB%AC%B8%EC%A7%80%2C+18%283%29&rft.au=%EB%B0%95%ED%83%9C%EC%A0%95&rft.date=2017&rft.pub=%ED%95%9C%EA%B5%AD%EB%94%94%EC%A7%80%ED%84%B8%EC%BD%98%ED%85%90%EC%B8%A0%ED%95%99%ED%9A%8C&rft.issn=1598-2009&rft.eissn=2287-738X&rft.spage=613&rft.epage=619&rft_id=info:doi/10.9728%2Fdcs.2017.18.3.613&rft.externalDBID=n%2Fa&rft.externalDocID=oai_kci_go_kr_ARTI_1392644 |
| thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1598-2009&client=summon |
| thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1598-2009&client=summon |
| thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1598-2009&client=summon |