GPU上的查询算子的设计与优化

TP311; 选择、连接、投影和聚集等是传统关系型数据库中的基本操作.为了实现关系型数据库在GPU上的查询优化,必须使用相应的GPU算法实现对应的关系算子.借鉴GDB分而治之的分层设计思想将关系代数拆分成算子层和原语层.数据查询处理过程中存在着一些难点问题,如数据传输时延、过度使用共享内存、活跃线程数减少和线程之间数据通信产生的通信时延.针对这些问题,基于较新的Pascal架构实现了查询优化算法,在原有的连接、聚集和条件选择算法原理基础上,对相应的算法进行了设计与优化.提高了每个工作线程的工作负载,实现了内核计算与数据传输之间的延迟隐藏,解决了连接操作中的数据倾斜问题....

Full description

Saved in:
Bibliographic Details
Published in计算机工程与应用 Vol. 59; no. 8; pp. 81 - 88
Main Authors 冷芳玲, 刘军, 吴莹莹, 鲍玉斌
Format Journal Article
LanguageChinese
Published 东北大学 计算机科学与工程学院,沈阳 110169%东北大学 信息化建设与网络安全办公室,沈阳 110169 15.04.2023
Subjects
Online AccessGet full text
ISSN1002-8331
DOI10.3778/j.issn.1002-8331.2208-0292

Cover

More Information
Summary:TP311; 选择、连接、投影和聚集等是传统关系型数据库中的基本操作.为了实现关系型数据库在GPU上的查询优化,必须使用相应的GPU算法实现对应的关系算子.借鉴GDB分而治之的分层设计思想将关系代数拆分成算子层和原语层.数据查询处理过程中存在着一些难点问题,如数据传输时延、过度使用共享内存、活跃线程数减少和线程之间数据通信产生的通信时延.针对这些问题,基于较新的Pascal架构实现了查询优化算法,在原有的连接、聚集和条件选择算法原理基础上,对相应的算法进行了设计与优化.提高了每个工作线程的工作负载,实现了内核计算与数据传输之间的延迟隐藏,解决了连接操作中的数据倾斜问题.
ISSN:1002-8331
DOI:10.3778/j.issn.1002-8331.2208-0292