NVIDIA GPU 架构梳理
发布网友
发布时间:2024-10-07 04:59
我来回答
共1个回答
热心网友
时间:2024-10-11 14:35
NVIDIA GPU架构的演进
在探索并行计算的领域中,NVIDIA GPU在高性能计算领域占据主导地位。本文将对NVIDIA GPU架构的演变进行总结,以帮助深入理解其发展历程。
本文中提到的最近8种NVIDIA GPU微架构,分别是特斯拉(Tesla)、费米(Fermi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pascal)、伏打(Volta)、图灵(Turing)和安培(Ampere)。其中最新架构为2020年宣布的Ampere架构。
Tesla架构是NVIDIA首个实现统一着色器模型的微架构,基于G80设计,开启了计算GPU的新纪元。Fermi架构作为NVIDIA自G80以来的最大飞跃,利用全新设计,专注于提升关键领域性能,如第三代流式多处理器、改进的内存子系统和NVIDIA GigaThread TM引擎。
Kepler架构在SM单元数量减少的同时,将每组单元中的CUDA内核数量增加,从32个激增至192个,体现了NVIDIA在GPU架构上的创新。
Maxwell架构进一步优化了SM单元设计,将四个Fermi架构的SM单元以2x2方式排列,形成SMM单元,每个单元包含四个32核处理块,提升了逻辑控制电路的精度和性能。
Pascal架构引入了核心概念,拥有GP100和GP102两种大核心,性能和制程工艺得到了显著提升,GPU模组包含60个SM单元,CUDA内核数量从每组64个增加到128个,并重新引入了DP双精度运算单元。
Volta架构在每个SM单元中引入了四个处理块,并拆分CUDA内核为FP32和INT32两部分,允许在同一时钟周期内同时执行浮点和整数指令,同时增加了Tensor Core张量单元,用于深度学习和AI运算。
Turing架构引入了三种核心,每个SM单元包含4个处理块,进一步优化架构设计,去掉了对FP64的支持。
Ampere架构在保留Tensor技术的同时,再次加入FP64核心,保持了自Volta架构以来的更新节奏,持续提升NVIDIA GPU的计算性能。
本文概述了NVIDIA GPU架构的演变过程,从Tesla架构到最新的Ampere架构,每一代架构都带来了显著的性能提升和技术创新,共同推动了GPU在高性能计算领域的进步。