位宽512bit显卡_6144 CUDA/512bit位宽 Maxwell架构曝光

  • Post author:
  • Post category:其他


【IT168 资讯】NVIDIA目前一代的显卡有GK104和GK110两大分支,它们的侧重点不同,但都是基于Kepler(开普勒,天文学家)架构的,下一代架构名为Maxwell(麦克斯韦尔,物理学家),根据之前的传闻Maxwell最快将在明年Q1季度问世,制程有可能继续使用TSMC的28nm工艺。现在网上又流传开Maxwell的架构设计了,旗舰GM100将有6144个CUDA核心,512bit位宽显存,显存容量达到了更夸张的8GB。

据WCCFTech报道,Maxwell架构也会同时推向游戏及计算两大市场,NVIDIA计划推出四款Maxwell架构GPU芯片——GM100、GM104、GM106和GM108。与Kepler架构相比,Maxwell将进一步增强SMX单元设计,优化双精度逻辑单元。

▲Maxwell线路图

介绍Maxwell之前最好了解一下Kepler架构,相关介绍可以参阅之前的文章:3倍性能从哪里来,GK110的SMX单元升级3.5代。目前Kepler架构中每组SMX单元有192个CUDA核心,Maxwell的SMX单元将进一步提升CUDA核心数到256个,不过DP双精度浮点单元的比例会从目前的1:3降低到1:4,算起来DP单元总数是保持不变的。256个CUDA核心的SMX单元将大幅增加Maxwell的CUDA总数,而DP双精度单元不用时是可以关闭的,这样也能降低能耗。

纹理单元方面,每组SMX单元会继续维持16个TMU单元,跟Kepler是一样的。

Maxwell的缓存设计也会进一步增强,每组SMX单元会额外增加2个寄存器,大量寄存器线程现在也可以并行运行了。L1缓存从Kepler架构的64kb增加到了128kb,而且可以作为共享内存使用,并且可以32/96、64/64、96/32的比例分配成缓存、共享内存。

L1缓存之外,每个GPC单元还会独享768kb L2缓存作为指令缓存。

具体的四款Maxwell芯片的详细架构如下所示:

GM110核心

目前的GK104核心有4组GPC单元,GK110是5组GPC单元,而GM110拥有8组GPC单元,每个GPC单元有三组SMX单元,每组SMX单元又有256个CUDA核心,这样总计有6144个CUDA核心,384个纹理单元,8MB L3缓存,64个ROP单元,512bit显存位宽,显存容量则达到夸张的8GB。

GM100无疑将取代GK110的旗舰地位,同时用于Tesla和GeForce高端产品线,不过这两个市场的GM100核心也有所不同:GeForce领域中的GM110核心频率在930MHz左右,加速频率1GHz左右,而Tesla中的GM110核心频率约为850MHz,双精度浮点性能达到了2.61TFLOPS。(作为对比的是GTX Titan目前的单精度性能是4.5FLOPS,双精度是1.3TFLOPS)

GM104核心

GM104核心将取代目前的GK104核心,后者的代表产品是GTX 680和GTX 770。

GM104的GPC单元数量降低到5组,拥有3840个CUDA核心,240个TMU纹理单元,40个ROP光栅单元,显存位宽降低到320bit,显存容量3GB,也可能是跟Fermi一样的2.5GB,不过显存位宽降低也使得频率可以更高,显存频率在7GHz左右,核心频率1GHz左右。

GM106核心

GM106核心将取代目前249美元以内的GK106核心的显卡,比如GTX 660、GTX 650 Ti、GTX 650 Ti Boost等。

不过GM106相对来说提升也是非常大的,CUDA核心将从目前的960个暴增到2304个,4MB L3缓存,144个纹理单元,24个ROP单元,显存位宽192bit,容量3GB,频率也能达到7GHz。

GM108核心

GM108之前其实还有GM107核心,目前后者的架构未知,不过驱动信息中已经有GM107存在的暗示了。

目前的ES样品显示GM108有576个CUDA核心,48个纹理单元,8个ROP单元,64bit显存位宽,核心面积跟GF117差不多。

丹佛计划将从Maxwell升级版时代开始?

在NVIDIA最神秘的计划中,Preject Denver丹佛计划最为引人注目,因为它将整合NVIDIA的GPU和ARM的CPU,有关这个处理器的进度一直没有明确消息。最新泄露的消息显示NIVIDIA在Maxwell升级版阶(GM11x)段推出丹佛计划,因为NVIDIA一直在等新的FinFET工艺成熟。这个说法跟NVIDIA在之前的GTC 2013大会上公布的进度有些相符。

▲丹佛处理器

丹佛处理器将整合64位ARM CPU核心,其中只有GM110会搭配8核丹佛处理器,GM110实际上应该被成为GM110 SoC处理器,已经不是单一的GPU或者CPU了。消费级的GM110将有4个CPU核心,整合的GPU则是GM114。整合GM116图形核心的丹佛则只会搭配2个CPU核心。泄露的报告没提到GM118核心整合什么丹佛核心,因此它很可能并不会使用新的架构。

丹佛处理器将有一致性总线(coherent link )用于连接CPU和GPU核心,并会在二者之间分配不同负载。爆料者称NVIDIA认为丹佛计划及相应的驱动优化会使他们的显卡比AMD为GCN架构优化的私有Mantle API更强。

目前最重要但是还不能确认的就是这些芯片是否能在2014年上半年发布,因为TSMC预计在2014年2月份才能量产20nm工艺,而且AMD预计在未来两个季度内使用14nm FinFET工艺流片新处理器,不过真正发布要等到2014年底甚至2015年初。这意味着2014年上半年最可能发布的还是他们的移动芯片,AMD是Crystal系列,NVIDIA是GTX 800M系列,而桌面版有可能到2014年下半年才能发布了。

▲Volta架构

2016年,NVIDIA会进入Vlota架构时代,根据之前在GTC 2013大会上公布的官方消息,Volta架构的带宽可达1TB/s。



版权声明:本文为weixin_30624767原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。