Nvidia presentó a principios de mayo la primera gráfica de arquitectura Volta, la Tesla V100. La compañía se centró en el modelo para centros de datos, en formato SXM2, que es una pequeña tarjeta con conector mezzanine —se sitúan varias contiguas en una placa base grande y encima el disipador—. Ahora ha presentado formalmente el modelo de Tesla V100 para ranuras PCIe, que tiene una potencia ligeramente distinta.

La frecuencia del procesador baja hasta los 1370 MHz desde los 1455 MHz, lo que hace que baje su consumo de los 300 W a los 250 W, y su potencia de cómputo de los 15 TFLOPS a los 14 TFLOPS, y el procesamiento tensorial de 120 a 112 TFLOPS. Los núcleos tensoriales son uno de los reclamos de esta tarjeta Tesla V100 para el sector empresarial, y se trata de un chip grandecito por ese motivo —815 mm2 frente a los 610 mm2 del P100—. Por último, este modelo carece del conexionado NVLink para conectarla con otras tarjetas Tesla V100.

Nvidia pondrá a la venta este modelo en formato tarjeta PCIe más adelante este mismo año a través de los fabricantes de sistemas y distribuidores oficiales de la compañía.

Tesla V100

(SXM2)

Tesla V100

(PCIe)

Núcleos CUDA51205120
Núcleos tensoriales640640
Frecuencia base??
Frecuencia turbo1455 MHz≈1370 MHz
Reloj de memoria1.75 Gb/s HBM21.75 Gb/s HBM2
Bus de datos de memoria4096 bits4096 bits
Ancho de banda de memoria900 GB/s900 GB/s
VRAM16 GB16 GB
Caché L26 MB6 MB
Media precisión30 TFLOPS28 TFLOPS
Precisión simple15 TFLOPS14 TFLOPS
Doble precisión7.5 TFLOPS

(tasa 1/2)

7 TFLOPS

(tasa 1/2)

Rendimiento tensorial

(aprendizaje profundo)

120 TFLOPS112 TFLOPS
GPUGV100 (815 mm2)GV100 (815 mm2)
N.º de transistores21 000 M21 000 M
TDP300 W250 W
Factor de formaMezzanine (SXM2)PCIe
RefrigeraciónPasivaPasiva
Proceso de fabricación12 nm FFN de TSMC12 nm FFN de TSMC

Vía: AnandTech.