Nvidia ha dado comienzo a su conferencia de la Gamescom, o más bien pre-Gamescom porque empieza oficialmente mañana, haciendo un repaso a los hitos del mundo de las tarjetas gráficas y los tipos de renderizado. Desde el uso inicial del trazado de rayos para renderizar escenas en películas a principios de los 80 y todo el tiempo que lleva renderizar cada fotograma, hasta el uso del trazado de rayos en juegos en tiempo real en la nueva serie de tarjetas gráficas GeForce.

Ha hecho un repaso a cómo se generan los gráficos con trazado de rayos, que es desde el punto de vista del observador hacia los objetos y de ahí a las fuentes de luz; todo ello una vez por cada píxel que hay en pantalla. Se hace así por comodidad, y para evitar calcular rayos que se vaya a ver en la escena mostrada. Ha hecho un repaso a los tipos de rayos, como los de reflexión para superficies translúcidas, que necesitan un tratamiento distinto. Se pueden crear a la perfección las zonas de iluminación en umbra y penumbra, como ocurre con la luz indirecta que entra por una ventana.

Qué es el trazado de rayos

Vídeo

Jen-Hsun Huang ha hecho una broma al inicio diciendo «quiero anunciaros la... GTX 1180», indicando que jamás ha visto tal nivel de rumores antes del lanzamiento de un producto, y que «todos los rumores están equivocados». Huang ha hecho un repaso a RTX, la biblioteca de trazado de rayos en tiempo real de la biblioteca apropiada de DirectX 12 que ha creado Microsoft con la ayuda de Nvidia (DXR), por lo que no es algo específico de esta compañía de gráficas, ya que AMD tendrá que implementarla también en sus Radeon. Ha sido más bien una clase magistral sobre trazado de rayos, para que la gente supiera de qué iban a hablar con las nuevas GeForce, y por qué es tan importante lo que ha conseguido Nvidia.

RTX es un renderizado híbrido, en el que se generan objetos en 3D y se identifica el color de cada píxel a mostrar en pantalla mediante un proceso de rasterización. Añadiendo trazado de rayos, se puede mejorar la calidad de las superficies calculando cómo inciden los puntos de iluminación sobre ella. Se mira cómo intersecciona los rayos de luz con una imagen rasterizada. La cantidad de información que hay que calcular es muy grande ya que hay que tener en cuenta todos los focos y todos los rebotes de superficies que puedan modificar la iluminación final de una superficie rasterizada. Eso lleva a en el vídeo de Epic Games basado en Phasma de Star Wars, que haya reflejos de reflejos de reflejos, creando escenas terriblemente complejas en términos de computación, que ahora se pueden hacer con la arquitectura Turing en tiempo real.

Vídeo

El desarrollo de Turing ha llevado diez años, como forma de revolucionar el núcleo CUDA. Ha hecho un repaso a que incluye núcleos tensoriales y núcleos específicos para trazado de rayos, que en el caso del chip usado en la Quadro RTX 8000 permite el tratamiento de 10 gigarrayos por segundo, más 14 TFLOPS de procesamiento general, y 110 TFLOPS en FP16 o 440 TOPS en INT4 los núcleos de cálculo tensorial incluidos. La GTX 1080 Ti podría ser capaz de 1.1 gigarrayos por segundo si no se dedicara a hacer nada más.

Puesto que hay una nueva forma de crear gráficos, Huang ha indicado que se necesita una nueva forma de calcular el rendimiento. Ha diseccionado lo que hay que hacer para crear un fotograma que incluya RTX, y gracias a los núcleos RT se puede reducir el tiempo de generación de las intersecciones de rayos con el rasterizado, o de otra forma la barra verde de a continuación sería diez veces mayor.

captura_de_pantalla_2018-08-20_a_las_18.49.47.png

Y se llega a la inteligencia artificial para inferir píxeles que puedan ser susceptibles de verse modificados por el trazado de rayos pero que no ha dado tiempo a calcular o que se puede saber de otras formas, y se hace gracias a las inferencias que realizan los núcleos tensoriales, que es por lo que son una parte imprescindible del trazado de rayos.

Esos núcleos tensoriales se dedican sobre todo a este tipo de cálculos de inteligencia artificial, los núcleos de trazado de rayos a las intersecciones de rayos de luz con los objetos rasterizados, y los núcleos CUDA a la generación de los gráficos 3D y al rasterizado general. Toda una arquitectura de las que quitan el hipo. La nueva métrica es RTX-OPS, u operaciones de RTX por segundo, que es la suma de todas las operaciones que está realizando para crear cada fotograma.

15.jpg

Y como muestra de dónde estamos antes de Turing, y después de Turing. Con respecto a Volta, alega un rendimiento seis veces mayor en trazado de rayos.

geforce-rtx.jpg
ejemplo.jpg

Para facilitar la ejecución de redes neuronales profundas, han crear los núcleos tensoriales, que permiten realizar inferencias mucho más rápido que con los núcleos normales de una tarjeta gráfica. Un tensor es una entidad algebraica compleja que se simplifica a nivel de circuito lógico, por lo que el uso de los núcleos tensoriales es casi exclusivo para ello. Se puede usar también para mejorar imágenes, detectar objetos, etc. Las redes neuronales ejecutadas son creadas en supercomputadoras, y son redes neuronales entrenadas y reentrenadas constantemente para mejorarlas.

Huang menciona NGX (aceleración neuronal de gráficos), que mejorará la calidad de los gráficos a través de la ejecución de redes neuronales entrenadas directamente sobre los núcleos tensoriales. Es hacia donde se dirige la generación de gráficos. Realización de predicciones en Turing a través de lo que se ha preentrenado en supercomputadoras.

Empieza lo bueno

captura_de_pantalla_2018-08-20_a_las_19.02.52.png

Mientras Huang se ha ido a la presentación de los primeros juegos que implementarán RTX —como Metro Exodus, Battlefield V y Shadow of the Tomb Raider, la web de Nvidia ha publicado las tres tarjetas gráficas que llegan con RTX. Son la GeForce RTX 2070, RTX 2080, y RTX 2080 Ti. Se confirman las especificaciones que se han venido rumoreando en los últimos días, y se añaden las frecuencias base y turbo de cada tarjeta gráficas.

Nvidia venderá una versión subida de las tarjetas de referencia con el nombre de edición fundador. Por ejemplo, la RTX 2080 tiene un turbo de 1800 MHz en vez de 1710 MHz, la RTX 2080 Ti tiene una frecuencia turbo de 1635 MHz en vez de 1545 MHz, y la RTX 2070 tiene una frecuencia turbo de 1710 MHz en vez de 1620 MHz.

captura_de_pantalla_2018-08-20_a_las_19.55.03.png

Los precios de las ediciones fundador de la RTX 2070 es de 599 dólares, la RTX 2080 son 799 dólares, y la RTX 2080 Ti son 1199 dólares, y estas dos últimas están disponibles para comprar en la web de Nvidia. Se envían el 20 de septiembre. La RTX 2070 llegará más adelante y no está disponible para comprar. La RTX 2070 de referencia costará 499 dólares, la RTX 2080 llega por un precio de 699 dólares, y la RTX 2080 Ti de referencia serán 999 dólares.

Tarjetas gráficas GeForce
GeForce RTX 2080 Ti GeForce GTX 1080 Ti GeForce RTX 2080 GeForce GTX 1080 GeForce RTX 2070 GeForce GTX 1070
Compañía NVIDIA NVIDIA NVIDIA NVIDIA NVIDIA NVIDIA
GPU TU102 GP102 TU104 GP104 TU106 GP104
Variante GPU TU102-300 GP102-350-A1 TU104-400-A1 GP104-400-A1 TU106-400-A1 GP104-200-A1
Tamaño del chip 754 mm2 471 mm2 545 mm2 314 mm2 445 mm2 314 mm2
Fundición 12 nm TSMC 16 nm 12 nm TSMC 16 nm 12 nm TSMC 16 nm
Multiproc. de flujos de datos 4352 3584 2944 2560 2304 1920
Frec. base 1350 MHz 1480 MHz 1515 MHz 1607 MHz 1410 MHz 1506 MHz
Frec. turbo 1545 MHz 1582 MHz 1710 MHz 1733 MHz 1620 MHz 1683 MHz
Uds. renderizado 88 88 64 64 64 64
Uds. textura 272 224 184 160 144 120
Tasa de texturas 420.24 GTexel/s 354.37 GTexel/s 314.64 GTexel/s 277.28 GTexel/s 233.28 GTexel/s 201.96 GTexel/s
Tasa de píxeles 135.96 GPixel/s 139.22 GPixel/s 109.44 GPixel/s 110.91 GPixel/s 103.68 GPixel/s 107.71 GPixel/s
Memoria 11 GB GDDR6 11 GB GDDR5X 8 GB GDDR6 8 GB GDDR5X 8 GB GDDR6 8 GB GDDR5
Frec. memoria 14 GHz 11 GHz 14 GHz 10 GHz 14 GHz 8 GHz
Ifaz. memoria 352 bits 352 bits 256 bits 256 bits 256 bits 256 bits
Ancho de banda de memoria 616.00 GB/s 484.00 GB/s 448.00 GB/s 320.00 GB/s 448.00 GB/s 256.00 GB/s
Consumo 250 W 250 W 215 W 180 W 175 W 150 W
Con. PCIe 2x 8 pines 1x 8 pines + 1x 6 pines 1x 6 pines, 1x 8 pines 1x 8 pines 1x 8 pines 1x 8 pines
Potencia de cómputo 13.45 TFLOPS 11.34 TFLOPS 10.07 TFLOPS 8.87 TFLOPS 7.46 TFLOPS 6.46 TFLOPS
PVPR 999 $ 699 $ 699 $ 599 $ 499 $ 379 $

Sobre la nueva estructura de las tarjetas gráficas, Nvidia promete que son absolutamente silenciosas, y de ahí que incluyan dos ventiladores. Son algo más grandes y anchas que los modelos a los que sustituyen. La RTX 2070 tiene una potencia de 45 RTX-OPS, la 2080 tiene 60 RTX-OPS, y la 2080 Ti tiene 78 RTX-OPS.

No me gusta que Nvidia diga que hay un gran salto generacional de potencia, cuando en juegos que no aprovechen RTX va a ser de apenas un 15 a 20 %. Pero bueno, es la típica venta de moto que hacen todas las tecnológicas, por lo que no esperéis una gran mejora de potencia entre la, por ejemplo, GTX 1080 y la RTX 2080 en juegos antiguos, a juzgar por los TFLOPS que tienen estas tarjetas gráficas.

captura_de_pantalla_2018-08-20_a_las_20.00.00.png