└── README.md /README.md: -------------------------------------------------------------------------------- 1 | # High-Performance-Computing 2 | ## 高性能计算-基础并行 3 | 程序的并行执行不仅仅和硬件相关,和算法的并行化设计分析有很大关系。 4 | * 并行程序设计导论:Peter,讲述MPI,pthread,openMP并行。 5 | * MPI可以参考mpi4py Python库,可以快速验证一些标准概念诸如(通信子,rank,数据收发,broadcast,gather,scatter等通信原语)。 6 | [mpi4py-examples](https://github.com/jbornschein/mpi4py-examples). 7 | * pthread可以参考C++11的thread多线程并发功能和Java多线程。 8 | * openMP可以参考[openMP资源](https://www.openmp.org/resources/)和[openMP简易教程-海康流行版本](http://read.pudn.com/downloads632/ebook/2565497/OpenMP%E7%AE%80%E6%98%93%E6%95%99%E7%A8%8B.pdf) 9 | 10 | 11 | ## 高性能计算-CUDA 12 | ### GPU编程优化-大众高性能计算 13 | * 理论篇:向量机和阵列机结构区别,英伟达GPU代次的计算能力单元硬件结构和功能差异。 14 | * 入门篇:总共四个范例,对应优达学城parallel-map,reduce,stencil,shared-memory例子,对应优达学城03节课。 15 | * 提高篇:讲述卷积(conv),规约(scan),归并、双调,奇偶排序,图像处理等高阶例子。 对应优达学城04节课 。 16 | * 核心篇:讲述GPU存储器体系(类似存储器山,openMP-MPI-Multi-Cuda)编程,可以和《并行编程导论》参考阅读。 17 | * 关于动态并行,stream/event 书中未涉及。 18 | 19 | ### 优达学城GPU编程 20 | 最好的GPU编程教学视频,另一个是周斌的GPU编程 21 | 参考GPU编程资料中04优达城GPU编程 22 | * 链接: https://pan.baidu.com/s/1NZt1ZW1qenXlOOPt07ZPfA 提取码: j69p 23 | 24 | 25 | ## 高性能计算-SIMD指令集 26 | 当前流行的avx2和arm-NEON指令。未涉猎。参考资料: 27 | * 未找到相关资料 28 | --------------------------------------------------------------------------------