NVIDIA的ARM架构融合处理器计划“丹佛工程”(Project Denver)已经宣布了很久,但是具体规格始终都是个迷,直到现在终于显露了一些蛛丝马迹。
丹佛处理器的设计正在和Tegra系列同步进行。第三代Kal-El Tegra 3定于今年晚些时候发布,而第四代Wayne Tegra 4预计未来两周左右完成流片,12月份向开发人员提供第一批原型芯片。根据传闻,Tegra 4第一版将有四个ARM处理器核心(具体架构不明)和至少24个流处理器,第二版会分别增加到八个和32-64个。
同样是在今年12月,丹佛处理器将完成首次流片,使用台积电28nm工艺。它将拥有最多八个NVIDIA自行开发的ARM 64位架构处理器核心,以及一个GeForce 600级别图形核心。后者并不意味着NVIDIA会在丹佛处理器中集成新的“开普勒”图形架构,而是现有“费米”架构的工艺改进版本。
同时有传闻称,28nm GeForce 600系列将出现在笔记本上和低端桌面上——这是否意味着开普勒家族会成为GeForce 700系列?
再回到丹佛处理器上,另一个消息来源称它的GPU图形核心部分会有“至少256个CUDA核心(流处理器)”,足以媲美AMD下一代采用推土机处理器、VLIW4 GPU架构的Trinity APU。
计算性能方面,NVIDIA并不会把丹佛处理器的频率设得非常高,一则是为了控制功耗,二则是NVIDIA更倾向于将IPC(每时钟周期指令数)提升到极致。预计丹佛的处理器部分频率会在2.0-2.5GHz左右,GPU部分类似。
内部互连设计上,丹佛处理器并不会像AMD APU那样以DDR3的速度将CPU、GPU连接到内存控制器上,而是采用更为直接、更为高速的方式,尤其是借助GPU所能提供的高带宽。NVIDIA不会采用传统的一级、二级和三级缓存方式,因为GPU与其缓存之间的带宽可以超过1TB/s,丹佛核心就会借鉴这种方式。
在丹佛中,内存控制器将占据很大一部分,并负责将CUDA核心与CPU核心连接在一起。CPU在访问所需带宽方面优先级更高,但是只需要总带宽的10-20%,其余都交给GPU。
与丹佛处理器配套的笔记本、台式机和服务器主板设计也正在进行之中,PCI-E 3.0、USB 3.0、SATA 6Gbps等三种高速传输标准都将在列。Tegra 3/4负责智能手机、平板机、超轻薄笔记本,丹佛处理器则进军主流笔记本、台式机以及服务器,特别是最后一项将让Tesla加速计算卡摆脱对x86的依赖,而搭档自己的处理器。