�� Kepler � �� Tesla K10 Tesla K20

�� NVIDIA �� Tesla (K10 � K20) �� GTC 2012. �� K10 �� 8�� GeForce GTX 690, � K20 �� , �� 7.1 �� .

�� GTC 2012 �� , �� Kepler GK110, �� NVIDIA Tesla K20 GPU. �� Jaguar.

�� , �� y� �� :

2880 �� CUDA
15�� SMX
384-��
�� 24 �� DDR5
�� ECC
�� (�� GPU �� , �� ).
�� Hyper-Q (�� CPU �� CUDA �� GPU Kepler).
�� GPU �� hardware ��.
�� 1.5 TFLOPS DP FP64
�� 250 Gb/s

�� , �� – �� . � �� NVIDIA �� “��” 6 – 12 GB �� , �� , ��, �� .

�� , �� “��”, �� , �� ,�� , �� 2013 �� (� �� NAB 2013). �� GTX 700 �� , �� GK110.

��  Kepler? � �� ?

�� NVIDIA �� Kepler �� “�� , �� ”.

�� NVIDIA � �� , � �� – �� . �� , �� . �� , �� , �� , �� , ��, �� . �� Fermi �� , �� , �� , � �� , �� , ��, �� .� �� Kepler �� . ��, ��

�� , �� .

�� = �� ?

�� 7.1 �� , �� , � �� , �� . �� “� ��” �� , �� , �� , ��, �� .

�� 1 TFlop � �� , �� 80% �� Fermi.

� �� , �� Kepler �� , � �� , �� , � �� Fermi.

�� :

��  – �� GPU �� , �� . �� GPU-�� , �� , ��
Hyper-Q – �� CPU �� CUDA �� GPU Kepler. �� GPU �� , �� CPU � �� . Hyper-Q – �� , �� MPI.
SMX ��  – �� GPU, SMX �� . �� 3 �� Fermi. �� SMX �� CUDA �� , �� GPU, �� , � �� GPU, �� .
GMU – �� CUDA �� . �� .
NVIDIA GPUDirect - �� , �� . �� (�� SSD/NIC/IB) �� GPU �� CPU. �� peer-to-peer �� . �� peer-to-peer �� ,��, �� .

��  GK110 Kepler

�� Kepler GK 110 �� Tesla (� �� ) � �� . �� , �� , � �� Fermi, �� .

�� 15�� SMX � �� 64 �� . �� , �� . � ��, �� SMX (�� 13 �� 15��). �� .

�� :

�� SMX
�� . �� , �� , �� (�� ) DRAM I/O.
�� .

�� Kepler GK 110 �� CUDA 3.5. � �� Fermi � Kepler ��.

��

�� GK 110 �� . �� Fermi �� Kepler, �� . �� , �� 28�� , �� . �� , �� .

�� , �� Kepler, �� . �� SMX ��, �� SMX � �� .

�� 

�� SMX ��, �� , �� .

�� Kepler GK 110 �� 129 CUDA ��, �� .

�� (�� ) � �� . �� HMC. �� . �� .

�� GK 110 ��-�� GPU �� , � �� , �� . �� , �� G80, � �� Tesla � �� . �� , �� , �� . �� Kepler, �� . �� , �� , �� , �� , �� . �� , �� .

�� 

�� , �� “waprs”. �� SMX �� 4 warp’a � �� . �� warp’�� .

�� , �� SMX ��. � �� (Fermi & Kepler) �� , �� , �� :

�� (�� )
�� GigaThread Engine
�� “��” ��

��, �� , �� Fermi �� hardware ��, �� . �� , �� , � �� .

� �� Kepler’�� , �� , �� . �� “��” �� .

�� 

�� , �� , �� (��).

�� 

�� . �� /��/�� . �� /��/��/��/�� , �� , �� . �� , �� , �� .�.

�� , �� . �� . �� GPU �� GPU �� . � �� Kepler �� 64�� . �� (�� atomicAdd,atomicCAS,atomicExch):

atomicMin
atomicMax
atomicAnd
atomicOr
atomicXor

�� ,�� , �� , �� compar�-and-swap (CAS) ��.

�� 

�� , �� GPU, �� , �� . �� Kepler �� , �� SMX �� 16 �� , �� .

�� , �� “��” � ��. �� Fermi �� “��” �� . �� , �� , �� “��” �� . � �� , Fermi �� 128 �� .

� �� Kepler �� . �� , �� , �� , � �� . �� , �� . �� .

�� 

�� . � �� -�� SMX ��. �� .

64 ��  L1 ��

� �� 64�� , �� . �� 48�� Shared memory � 16KB �� L1 ��.

�� L1 ��, �� (32/32) �� . �� SMX c 64 �� 256 �� .

48 �� “�� ”

� �� L1, � �� Kepler �� , � �� 48�� , �� . � �� Fermi �� . �� , �� , �� .

� Kepler’e �� , �� . �� SMX ��, �� , �� . �� . �� .

�� -�� L2

� �� ,�� Kepler, �� 1536KB �� L2 ��, �� Fermi . �� SMX �� , �� , �� , �� GPU. �� . �� , � �� , �� , �� , �� .

�� 

�� , �� Fermi, � �� Kepler �� Single‐Error Correct Double‐Error Detect (SECDED) ECC ��. � �� , �� , �� “��” � �� . �� . � �� , � �� “�� ” ��. � �� (�.� �� ) �� .

�� 

� �� GPU – CPU ��, �� GPU �� . �� , �� . �.� �� , �� GPU �� , � �� .

� �� Fermi, �� Kepler �� , � �� , �� . �� . �� GPU, �� .

�.� �� .

Hyper –Q

�� – �� , �� . � �� Fermi �� 16�� , �� . � �� Kepler �� Hyper-Q. �� (�.� ��) � CWD ��, �� GPU �� 32 �� . �� CUDA ��, �� MPI �� .� �� .

�� MPI ��, �� . �� Hyper-Q �� , �� GPU � MPI ��.

�� NVIDIA GPUDirect™

�� , �� . �� , �� , �� GPU ��. �� :

�� GPU
�� MPISend/MPIRecv
��
�� , �� “��”.

�� ( �� , �� ) �� GPU �� . �� GPU �� . �� GPUDirect �� , �� . �� , �� . � �� , �� .

�� , �� “��” �� , �� … �� ,�� , �� Jaguar. �� , �� .

��

� �� Fermi, �� NVIDIA �� , �� , �� . ��, �� , �� , �� HMC. �� , �� , �� , �� . �� , �� , �� Kepler �� , �� , �� “��” ��.

�� Kepler � �� Tesla K10, Tesla K20

�� :

��: 0 ��

��

��

����������� Kepler � �� ����������� Tesla K10, Tesla K20

����������� � ���������:

�����������: 0 ��������

������� �� ����

������� �������

�� Kepler � �� Tesla K10, Tesla K20

�� :

��: 0 ��

��

��