当前位置:操作系统 > 电脑通通透 >>

全面分析AMD与GCN架构技术

     2011年12月22日,AMD正式公布其新一代HD7000系列显卡,在新一代显卡中,AMD引入了最新的GCN架构,除了很多的3D运算之外,还大大加强了GPU通用计算的功能,是AMD参考R600架构面市以来规模最大的变革。当GCN架构到底存在何过人之处呢?一起来明白一下吧。

      VLIW模式可以跟不上时代

      AMD自R600以来一直坚持VLIW模式,VLIW(超长指令字)可以用好多条指令连在一起,建成一个超长指令,促使GPU的运算单元可以一次启动连续执行,省去了好多调度指令、等待周期,参考而提高运算效率。但VLIW在多个流处理器并行性上存在多数难以预料的逻辑缺陷,在GPU这种规模越来越大的并行处理器上,数千个流处理器的整体吞吐率反而受到影响。

    再加上DirectX 11需要GPU架构拥存在更好的灵活度和通用计算能力,而非很多意义上的单纯吞吐能力。VLIW模式高吞吐低灵活性的特点,在通用计算可以图形计算的今天可以显得存在些呆板了。

 

全面分析AMD与GCN架构技术
VLIW是打包后的超长指令,单线程执行密度很高


    CU单元——GPU的基本单位

    AMD对GCN架构的定义为“Non-VLIW ISA With Scalar+Vector Unint”——使用标量和矢量单元的非VLIW体系,GPU的组成单元不会是SIMD阵列,而是被称为“Compute Unit”的计算单元(简称CU)。

    大家引入了HD7970显卡作为例子,为大家详细介绍CU单元。HD7970拥存在2048个流处理器,被划分成了32个计算单元,每个计算单元总相当于一个运算中枢,在芯片高负荷时,每个计算单元总能同时分配、执行指令,架构使用率和吞吐量很高,更适合处理多线程多任务并行运算。

 

全面分析AMD与GCN架构技术
HD7970的2048个流处理器被划分成了32个"GCN"并行执行单元

 

全面分析AMD与GCN架构技术
一个GCN计算单元的内部结构图(包含4个矢量单元)

      这32个并行计算单元中,每个单元内部拥存在64个流处理器,这一系列流处理器组成4个矢量单元,每个矢量单元搭配64KB矢量寄存器。每个计算单元内部还具备数据寄存器和多数辅助性功能模块,共同组成了一个完整的运算中枢。再通过新指令集,促使每个计算单元总能同时领取、执行指令,众多计算单元并行处理能力很高,促使计算单元的使用率和指令吞吐量反而比VLIW更高。

 

 全面分析AMD与GCN架构技术
完整的GCN架构流水线示意图(居中的是32个并行计算单元)

      近年来,GPU芯片通过堆流处理器换能力的做法缺点比较明显,打个比方寄存器端口冲突、调度指令复杂等,所以越多流处理器越难以达到理论峰值能力。GCN架构在规划上更为清晰、直接,32个并行运算单元,很存在针对性的处理了寄存器端口的冲突疑问,以高灵活度消除了好多潜在的逻辑死锁毛病,参考而促使芯片能力更稳定,实际能力表现更接近理论预测值。

     缓存设计——通用计算的重要条件

      缓存设计或许对图形计算影响不大,但对于通用计算来说是相当重要的。因为存在矢量单元又存在标量单元,所以GCN的缓存通过了重新设计,引入了多层次缓存,规模相当庞大而复杂。每个单元存在16KB的数据缓存,每四个计算单元再共享16K指令缓存和32KB L1标量数据缓存,并与二级缓存相连;每个计算单元总存在个人的寄存器和本地数据共享,搭配16KB可读写一级缓存,每时钟周期带宽为64字节。

      二级缓存总空间768KB,可读写,对应每个显存控制器分成六组,每组空间128KB,每时钟周期带宽也是64字节;全局数据共享则用于不一样计算单元之间的同步辅助。

 

全面分析AMD与GCN架构技术
GCN架构引入了多层次缓存


     通用计算还需软件支持

     在公布GCN架构时,AMD表达出了图形可以计算,计算可以图形的宏大理希望。大家仍以HD7970为例,参考AMD官方给出的数据来看,执行诸如光线追踪渲染、加密、傅里叶转换等常见的通用计算,可以观察HD7970与上一代产品相比,能力提高幅度无低于50%的,像AES256甚至超过 3 倍。

     对于通用计算来说,软件平台的支持也很重要。GCN架构具备相当的可编程性,用会支持C、C++还存在还存在高级编程语言。除此之外,AMD也在寻找差不多合作伙伴来体现GPU的通用计算能力。AMD目前正在与WinZip合作设计16.5版本的差不多特性,WinZip用可使用OpenCL加速压缩/解压缩/AES加密的编码速度。

 

全面分析AMD与GCN架构技术
HD7970通用计算能力提高明显


     高能力计算是GPU的无来

     参考PC进化高度来看,CPU融合GPU的大方向可以难以扭转,当一来,保持数倍、数十倍于整合显卡的能力权威,用是独立GPU芯片继续存在的重要保障。还存在,自参考GPU微架构转向流处理器结构,GPU通用运算技术也日益被提上日程。但不管是图形运算或者通用运算,“高能力”总用是终极的诉求,所以,在HD7970上,AMD的GCN架构可以转变了思维,高效能和高能力运算概念正式回归,通用运算可以变得和图形运算一样重要,这正是GPU芯片的无来出路。

CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,