GPU 하드웨어 아키텍처 기반 sub-warp 단위 병렬 프리픽스(prefix) 연산의 정확한 구현

본 논문에서는 대규모 데이터를 길이가 32 미만인 로컬 세그먼트 단위로 구분하고 이 로컬 세그먼트 내에서 정확한 GPU 병렬 프리픽스(prefix) 연산 결과를 출력하는 CUDA (Compute Unified Device Architecture) 코드를 제시한다. 이미 Mark Harris와 Michael Garland가 이러한 목적을 수행하기 위한 CUDA 코드를 이미 발표한 바 있으나 본 논문에서는 로컬 세그먼트의 길이가 32 미만일 때 기존 코드의 결과가 정확하지 않다는 사실을 살펴 보고 그 원인을 논의한 후, 정확한 결과를...

Full description

Saved in:
Bibliographic Details
Published in디지털콘텐츠학회논문지 Vol. 18; no. 3; pp. 613 - 619
Main Author 박태정(Taejung Park)
Format Journal Article
LanguageKorean
Published 한국디지털콘텐츠학회 2017
Subjects
Online AccessGet full text
ISSN1598-2009
2287-738X
DOI10.9728/dcs.2017.18.3.613

Cover

Abstract 본 논문에서는 대규모 데이터를 길이가 32 미만인 로컬 세그먼트 단위로 구분하고 이 로컬 세그먼트 내에서 정확한 GPU 병렬 프리픽스(prefix) 연산 결과를 출력하는 CUDA (Compute Unified Device Architecture) 코드를 제시한다. 이미 Mark Harris와 Michael Garland가 이러한 목적을 수행하기 위한 CUDA 코드를 이미 발표한 바 있으나 본 논문에서는 로컬 세그먼트의 길이가 32 미만일 때 기존 코드의 결과가 정확하지 않다는 사실을 살펴 보고 그 원인을 논의한 후, 정확한 결과를 출력하는 코드를 제안한다. 본 논문에서 다루는 로컬 세그먼트 단위의 병렬 프리픽스 연산은 최인접 요소 탐색(k-nearest neighbor search) 등은 물론 다양한 대규모 병렬 처리 알고리즘을 구성하는 기본 연산으로 활용 가능하다. This paper presents a CUDA (Compute Unified Device Architecture) code to achieve correct GPU parallel segmented prefix operation results with less than 32 segment length for large data arrays. Mark Harris and Michael Garland had published CUDA code to address the tasks. This paper shows that their code does not generate correct results when the local segment length is less than 32, discusses the cause of the problem, and presents a CUDA code that generates correct results. The segmented parallel prefix operation presented in this paper can be applied as a building block to various large parallel processing algorithms including the k-nearest neighbor search problems. KCI Citation Count: 1
AbstractList 본 논문에서는 대규모 데이터를 길이가 32 미만인 로컬 세그먼트 단위로 구분하고 이 로컬 세그먼트 내에서 정확한 GPU 병렬 프리픽스(prefix) 연산 결과를 출력하는 CUDA (Compute Unified Device Architecture) 코드를 제시한다. 이미 Mark Harris와 Michael Garland가 이러한 목적을 수행하기 위한 CUDA 코드를 이미 발표한 바 있으나 본 논문에서는 로컬 세그먼트의 길이가 32 미만일 때 기존 코드의 결과가 정확하지 않다는 사실을 살펴 보고 그 원인을 논의한 후, 정확한 결과를 출력하는 코드를 제안한다. 본 논문에서 다루는 로컬 세그먼트 단위의 병렬 프리픽스 연산은 최인접 요소 탐색(k-nearest neighbor search) 등은 물론 다양한 대규모 병렬 처리 알고리즘을 구성하는 기본 연산으로 활용 가능하다. This paper presents a CUDA (Compute Unified Device Architecture) code to achieve correct GPU parallel segmented prefix operation results with less than 32 segment length for large data arrays. Mark Harris and Michael Garland had published CUDA code to address the tasks. This paper shows that their code does not generate correct results when the local segment length is less than 32, discusses the cause of the problem, and presents a CUDA code that generates correct results. The segmented parallel prefix operation presented in this paper can be applied as a building block to various large parallel processing algorithms including the k-nearest neighbor search problems. KCI Citation Count: 1
Author 박태정(Taejung Park)
Author_xml – sequence: 1
  fullname: 박태정(Taejung Park)
BackLink https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002237955$$DAccess content in National Research Foundation of Korea (NRF)
BookMark eNotkD1Lw0AAhg9RsGp_gNstgg6JubukdzeK1g8oVqSCW7gmdxKqbUkQdZW6KA5ioxErdCjSoUPxA1z8Q83lP1i10_MOD8_wzoHpeqMuAVhElskpZqu-F5nYQtREzCRmAZEpkMOYUYMSdjgNcsjhzMCWxWdBPoqCquUQQinGOAdqW3sHMIuT9L6jn_v64QPquJVd9rKrW_2WwNHXMB0mMDqtGmcibML0pq87LZi-36XdAczarfR1kLW_9XVvuRlKFZyvQP041JdD_ZJA3Y2zpziLO3D0OciS1gKYUeI4kvkJ50Fls1hZ3zZK5a2d9bWSUeM2MxxFpUSEethypF9lRAllFyRWiiEP-9gWNhWc-gUluWdxxJn0qE99ZFepcBgj82DlP1sPlVvzArchgj8eNdxa6K7tV3ZcRDgu2PbYXZq4p2FwIv1AuM3xEOGFu1veKFq_JyGbkR8bTIVG
ContentType Journal Article
DBID DBRKI
TDB
ACYCR
DOI 10.9728/dcs.2017.18.3.613
DatabaseName DBPIA - 디비피아
Nurimedia DBPIA Journals
Korean Citation Index
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
DocumentTitleAlternate Correct Implementation of Sub-warp Parallel Prefix Operations based on GPU Hardware Architecture
DocumentTitle_FL Correct Implementation of Sub-warp Parallel Prefix Operations based on GPU Hardware Architecture
EISSN 2287-738X
EndPage 619
ExternalDocumentID oai_kci_go_kr_ARTI_1392644
NODE07222148
GroupedDBID ALMA_UNASSIGNED_HOLDINGS
DBRKI
M~E
TDB
ACYCR
ID FETCH-LOGICAL-k948-5f7ee137c205edb83faf46e2ff81c2d24a47a97d6fe9c09198ec7d7d14b7a5883
ISSN 1598-2009
IngestDate Wed Apr 23 03:12:22 EDT 2025
Thu Feb 06 13:21:58 EST 2025
IsDoiOpenAccess false
IsOpenAccess true
IsPeerReviewed true
IsScholarly true
Issue 3
Keywords CUDA
Segmented exclusive scan
Parallel prefix operation
세그먼트 적용 익스클루시브 스캔
병렬 프리픽스 연산
GPGPU
Language Korean
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-k948-5f7ee137c205edb83faf46e2ff81c2d24a47a97d6fe9c09198ec7d7d14b7a5883
Notes http://dx.doi.org/10.9728/dcs.2017.18.3.613
OpenAccessLink http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201720636501238&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01
PageCount 7
ParticipantIDs nrf_kci_oai_kci_go_kr_ARTI_1392644
nurimedia_primary_NODE07222148
PublicationCentury 2000
PublicationDate 2017
PublicationDateYYYYMMDD 2017-01-01
PublicationDate_xml – year: 2017
  text: 2017
PublicationDecade 2010
PublicationTitle 디지털콘텐츠학회논문지
PublicationYear 2017
Publisher 한국디지털콘텐츠학회
Publisher_xml – name: 한국디지털콘텐츠학회
SSID ssib053377222
ssib008451574
ssib049971524
ssib036278589
ssib053682487
Score 1.9869726
Snippet 본 논문에서는 대규모 데이터를 길이가 32 미만인 로컬 세그먼트 단위로 구분하고 이 로컬 세그먼트 내에서 정확한 GPU 병렬 프리픽스(prefix) 연산 결과를 출력하는 CUDA...
SourceID nrf
nurimedia
SourceType Open Website
Publisher
StartPage 613
SubjectTerms 컴퓨터학
Title GPU 하드웨어 아키텍처 기반 sub-warp 단위 병렬 프리픽스(prefix) 연산의 정확한 구현
URI https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE07222148
https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002237955
Volume 18
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX 디지털콘텐츠학회논문지, 2017, 18(3), , pp.613-619
journalDatabaseRights – providerCode: PRVHPJ
  databaseName: ROAD: Directory of Open Access Scholarly Resources
  customDbUrl:
  eissn: 2287-738X
  dateEnd: 99991231
  omitProxy: true
  ssIdentifier: ssib053682487
  issn: 1598-2009
  databaseCode: M~E
  dateStart: 20000101
  isFulltext: true
  titleUrlDefault: https://road.issn.org
  providerName: ISSN International Centre
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrR1Na9RANLT1oBdRVKwfJYgDSsmaj0lm5phkV6tg9dBCb8smmUhZ2Ja1i-LBQ1kvigexqyu20EORHnpY_AAv_qFu8h98M7NJ16pQixCGx0vmzXvzZvLeG2bmadp1h0RgSD1uJC43DXGlucHALhg4BeOYRp4ZN8Rp5Pvz3twivrfkLk1Mbo3tWuqsRZX42R_PlRxHq4ADvYpTsv-g2ZIoIAAG_UIJGobySDq-83BxFtWqiLmIUVQLEHMQC1EtRCxAPpWAhwI8KyEXUSy-pjbyFQCYqngV2FAfPvJRQFFgCkpQAupxJzKeNNqrswJFS5ohUJKoANqzBOCbyA8VL1g2AygPUCNMIJuhvmhY7jxJl5_K9QhBjcgmQ8GXAlhVsRMKssC2oMEKAEQNFatuQZ8ilf-tcLJlT2DxCBJEbOYQ0mIhnZBWVlHyM9kg4H2zoM4k4CMaSqFdFEjAD0fVFUEYmRYFWcYXqot-k4zSQhVShvHFFXWKVE6EUqJCoOr_4n3c2DA5nhWbXOJsiGAN4sh0y4VR8dRp3ZF_4ikTc9j0MWKL4xxJLO6gt0jFohWnUtYcv2b8kPn_5aLxZrxcf7RSb7brEE7drUN4IBzmSe2ELZa7xM7Y57Xyd00xOMMH0QO4QoS6B8kLIJYm4B2W7yGwgFDu4LZI1_GojWUKy7In1L4DIcut3yQB76_VBqfxZKsjMl_A73PME1w4o50ehXC6r-bjWW2iuXJOa8Jc1PNef_h2M_u4m737qme9br6-k794nX3u6_vfB8NBXy_mkz58tZttdvXhlzfD7T093-gOP-3lGz-ylzs31Oy4qWfvB9n6INvq69l2L__Qy3ub-v63vbzfPa8t3K4thHPGKJGJ0WSYGm5KOLccEtumy5OIOmkjxR6305RasZ3YuIFJg5HESzmLwX9nlMckIYmFI9JwKXUuaFOtlRa_qOkOT0XKV-4mDYajiEZezCBG5qYdxTjGdFq7Bn0k1fh3dU5rM2UX1lfVpTb1-QfVminUY2F66ShULmunhHrUcuQVbWqt3eFXwUFfi2bkMPkJ7pG6Aw
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=GPU+%ED%95%98%EB%93%9C%EC%9B%A8%EC%96%B4+%EC%95%84%ED%82%A4%ED%85%8D%EC%B2%98+%EA%B8%B0%EB%B0%98+sub-warp+%EB%8B%A8%EC%9C%84+%EB%B3%91%EB%A0%AC+%ED%94%84%EB%A6%AC%ED%94%BD%EC%8A%A4%28prefix%29+%EC%97%B0%EC%82%B0%EC%9D%98+%EC%A0%95%ED%99%95%ED%95%9C+%EA%B5%AC%ED%98%84&rft.jtitle=%EB%94%94%EC%A7%80%ED%84%B8%EC%BD%98%ED%85%90%EC%B8%A0%ED%95%99%ED%9A%8C%EB%85%BC%EB%AC%B8%EC%A7%80%2C+18%283%29&rft.au=%EB%B0%95%ED%83%9C%EC%A0%95&rft.date=2017&rft.pub=%ED%95%9C%EA%B5%AD%EB%94%94%EC%A7%80%ED%84%B8%EC%BD%98%ED%85%90%EC%B8%A0%ED%95%99%ED%9A%8C&rft.issn=1598-2009&rft.eissn=2287-738X&rft.spage=613&rft.epage=619&rft_id=info:doi/10.9728%2Fdcs.2017.18.3.613&rft.externalDBID=n%2Fa&rft.externalDocID=oai_kci_go_kr_ARTI_1392644
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1598-2009&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1598-2009&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1598-2009&client=summon