面向E级计算的线性代数解法器研究综述
TP301; 基于E级计算的科学工程计算应用给数值线性代数算法的发展,既提供了更多机遇,又带来了更大挑战.首先分析了E级计算的特点,包括:针对大规模异构并行体系结构的并行编程成为主流方式;降低运行大规模应用带来的极高能耗成本成为了主要考虑问题;多精度的异构计算硬件引发了混合精度算法进一步的研发.其次综述了主流稠密及稀疏线性代数解法器面向高性能计算体系架构进行的功能及性能方面的优化工作,对比分析了各解法器的特点及优势.随后总结分析了线性代数解法器核心技术进展,主要包括:隔离异构计算模块和设计新的统一编程框架,以实现软件算法的性能可移植;在保证科学工程计算应用的整体需求之下,利用混合精度方法提升数...
        Saved in:
      
    
          | Published in | 计算机科学与探索 Vol. 17; no. 10; pp. 2265 - 2277 | 
|---|---|
| Main Authors | , , | 
| Format | Journal Article | 
| Language | Chinese | 
| Published | 
            中国科学院 计算机网络信息中心,北京 100190
    
        10.10.2023
     | 
| Subjects | |
| Online Access | Get full text | 
| ISSN | 1673-9418 | 
| DOI | 10.3778/j.issn.1673-9418.2303076 | 
Cover
| Summary: | TP301; 基于E级计算的科学工程计算应用给数值线性代数算法的发展,既提供了更多机遇,又带来了更大挑战.首先分析了E级计算的特点,包括:针对大规模异构并行体系结构的并行编程成为主流方式;降低运行大规模应用带来的极高能耗成本成为了主要考虑问题;多精度的异构计算硬件引发了混合精度算法进一步的研发.其次综述了主流稠密及稀疏线性代数解法器面向高性能计算体系架构进行的功能及性能方面的优化工作,对比分析了各解法器的特点及优势.随后总结分析了线性代数解法器核心技术进展,主要包括:隔离异构计算模块和设计新的统一编程框架,以实现软件算法的性能可移植;在保证科学工程计算应用的整体需求之下,利用混合精度方法提升数值计算和数据存储的性能水平;结合硬件多级cache和网络通讯特征发展先进并行计算算法,避免或减少效率低下的大规模数据通讯.最后对未来研究进行了展望. | 
|---|---|
| ISSN: | 1673-9418 | 
| DOI: | 10.3778/j.issn.1673-9418.2303076 |