CUDA 编程 (CUDA Programming)
本目录包含 NVIDIA CUDA 编程的核心概念介绍与基础实践指南。
1. GPU 编程导论
GPU Architecture and Programming — An Introduction:
- 介绍了 GPU 的分层执行模型:Grid, Block, Warp, Thread。
- 解释了 SIMT (Single-Instruction Multiple-Threads) 的基本原理。
- 包含架构图解与核心概念辨析。
2. CUDA 核心详解
- 深入解析 Nvidia CUDA 核心(CUDA Cores)的硬件架构。
- 探讨计算单元的组成与工作方式。
3. CUDA 流处理
- 详细介绍 CUDA Streams 的概念。
- 讲解如何利用流实现并发执行(计算与数据传输的重叠)。
- 异步编程模型的基础。
4. SIMT 到 Tile-Based 编程范式
- 从 SIMT 到 Tile-Based:GPU 编程范式的演进与实战解析
- 剖析 NVIDIA cuTile 编程模型。
- 对比传统 SIMT (Thread 视角) 与 Tile-Based (Block/Tile 视角) 的编程思维。
- 以矩阵乘法 (GEMM) 为例展示 Tensor Core 的抽象与使用。
5. CUDA 编程简介 - 基础与实践.pdf
- 一份完整的 CUDA 编程入门讲义(PDF 格式)。
- 涵盖环境搭建、基础语法、内存管理与实战案例。