英伟达新一代旗舰显卡GeForce RTX 4090,机能剽悍,
2025-02-02 08:32
英伟达最新宣布的 Blackwell GPU 架构白皮书,提醒了 GeForce RTX 50 系列显卡的进步技巧细节。此中最值得留神的是,Blackwell 架构中的全部单精度 CUDA 中心同时支撑 FP32 / INT32 数据范例,这一计划回到了九年前的 Pascal 架构时期。在 Pascal 架构中,英伟达采取了单精度 CUDA 单位统筹 FP32 / INT32 的计划。但是,在 Volta 跟 Turing 两代架构中,英伟达转变了战略,分辨应用了两组 1:1 比例的 CUDA 中心来承当 INT32 跟 FP32 的义务。离开 Ampere 架构时期,每个 SM 流式处置器的四个处置块之一供给了 1 组 16 个 FP32 / INT32 单位跟 1 组 16 个纯 FP32 单位。而在 Ada GPU 上,这种计划失掉连续。Blackwell 架构实现了对 CUDA 的同一处置。这象征着每台 SM 装备都具有更高的 INT32 整数运算才能,相较于 Ada 架构晋升了一倍。但是,在任何给定的时钟周期内,Blackwell 架构只能以 FP32 或 INT32 形式中的一种运转。英伟达提到,Ada 架构的 SM 装备是为尺度着色器计划跟优化而构建的,而 Blackwell SM 则是为了顺应神经收集着色器计划跟优化需要而构建的。总而言之,GeForce RTX 50 系列显卡采取了进步的 Blackwell 架构,并在机能方面获得了明显冲破。这一系列显卡将为用户带来更强盛的盘算才能跟更好的神经收集处置后果。
相关推荐