开普勒 GK110性能

NVIDIA对K20的描述是“3倍双精度浮点性能”，并有Hyper-Q、Dynamic Parallelism等多种并行计算技术加持，这些是现有的GK104架构不具备的。

除去其他的功能单元之外，GK110核心总***有15组SMX单元，2880个CUDA核心，但是Heise声称并非所有单元都是启用的，实际上可能只有13-14组SMX单元，实际CUDA核心是2496或者2688个。

显存位宽是384bit，已为黄仁勋和NVIDIA CTO确认。由于CUDA核心数已经低于之前的报道，显存位宽降到384bit也是很自然的事，如果保持GK104的6Gbps显存速率，那么GK110的带宽将达到288GB/s，终于超过AMD GCN架构的260GB/s了。

NVIDIA给出的3倍双精度浮点性能不知是跟GF110显卡还是跟GF110核心的Tesla加速卡做的比较，GF110的单精度浮点能力为1.58TFLOPS，显卡中的双精度为单精度的1/4，也就是0.4TFLOPS，但是GF110核心的Tesla卡双精度能力可达单精度1/2，大约是0.8TFLOPS。

如此一来，如果以显卡为基础，GK110的双精度浮点性能大约是1.2TFLOPS以上，如果是Tesla卡的3倍，那就是2.4TFLOPS以上，鉴于后者已经超出之前传闻的2TFLOPS的能力，GK110的双精度浮点能力应该是1.2TFLOPS或更高。