针对高性能计算的性能优化与分析。

您将会学到

  • 全面理解GPU与CPU架构
  • 学习图形处理单元(GPU)的历史直到最近的产品
  • 了解GPU的内部结构
  • 了解不同类型的内存及其对性能的影响
  • 理解GPU内部组件中的最新技术
  • 了解GPU上CUDA编程的基础知识
  • 使用CUDA在Windows和Linux上开始GPU编程
  • 理解并行化的最有效方法
  • 分析与性能调优
  • 利用共享内存

课程要求

  • C 和 C++基础知识
  • Linux 和 Windows基础知识
  • 计算机体系结构基础知识

课程描述

这门动手实践课程教你如何通过CUDA释放现代GPU的并行处理能力。你将从GPU硬件的基础知识开始,追溯旗舰架构的发展历程(Fermi → Pascal → Volta → Ampere → Hopper),并通过实际编码实验学习如何编写、分析和优化高性能内核。

这是一个独立的培训资源,未得到NVIDIA公司的赞助、认可或任何形式的关联。“CUDA”、“Nsight”及架构代号均为NVIDIA的商标,这里仅作为事实性引用使用。

你将掌握的内容包括

  • GPU与CPU基础 – 了解为何在数据并行工作负载中GPU占据主导地位。
  • 代际设计进步 – 对性能最为关键的硬件特性。
  • CUDA工具包安装 – 包括Windows、Linux以及WSL环境下的安装指南,还有初次运行时的检查步骤。
  • CUDA核心概念 – 通过如向量加法等实验构建线程、块、网格和内存层次结构的知识。
  • 使用Nsight Compute / nvprof进行剖析与调优 – 学习测量占用率、隐藏延迟、打破瓶颈。
  • 矩阵的2D索引 – 编写高效内核以应对现实中的线性代数任务。
  • 优化手册 – 处理非2的幂次数据、利用共享内存、最大化带宽、最小化warp分歧。
  • 强大的调试与错误处理 – 使用运行时API检查来确保代码生产就绪。

完成课程后,你将能够设计、分析并微调在当今GPU上高效运行的CUDA内核,使你有能力应对要求苛刻的科学、工程和AI工作负载。

适合人群

适用于所有对 GPU 和 CUDA 感兴趣的群体,包括工程专业的学生、研究人员等

声明:本站所有资源、素材等全部来源于互联网,赞助VIP仅用于对IT资源服务器带宽等费用支出做支持,从本站下载资源,说明你已同意本条款。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。