Nvidia va a dar el visto bueno el 20 de septiembre para que se pongan a la venta las GeForce RTX 2080 y 2080 Ti, poniéndose a la venta la RTX 2070 probablemente a finales de octubre. Mientras tanto, hay bastantes incógnitas que resolver sobre la arquitectura Turing, como el diagrama de bloques de la misma para ver cómo está, y es lo que ha venido a publica Vdeocardz. Aunque no se lee bien lo que pone, al menos se ve que no cambia mucho la estructura, aunque sí que cambia un poco.

Según esta información, y sin demasiadas sorpresas, el chip TU102 desbloqueado dispone de 4608 núcleos CUDA, 576 tensoriales, 72 de trazado de rayos, 36 unidades de geometría, 288 de texturas, 96 de rasterizado, con doce controladores de memoria de 32 bits (384 bits en total) para memoria GDDR6 a 14 Gb/s. También dispone de dos canales NVLink para hacer SLI.

nvidia-tu102-gpu-block-diagram.jpg
Diagrama del SM de Volta

No se ve bien la configuración de los multriprocesadores de flujos de datos (SM), pero debería ser como lo indicado por Nvidia para Volta, porque comparten gran parte de la arquitectura. Los CUDA están divididos en los que ejecutan instrucciones en coma flotante y en enteros, lo que tiene ventajas para operaciones como la multiplicación-suma fusionada —se hace en un solo paso, incluido un redondeo— o la generación de los espacios de memoria, que resulta muy útil en generación de gráficos.

Los núcleos tensoriales están integrados en los SM, pero lo que no se sabe es dónde caen los núcleos de trazado de rayos en todo esto, y cualquier otro cambio que haya realizado Nvidia a cosas como la compresión de memoria, si bien sí se sabe que la caché del chip está unificada.

En total en el diagrama de arriba se ven 72 SM, y el chip incluido en la RTX 2080 Ti tiene 68 SM, lo que arroja sus 4352 núcleos CUDA, 88 de rasterizado, 272 de texturas, 68 de trazado de rayos, y 544 núcleos tensoriales. Puesto que llega con 11 GB de VRAM, tiene un controlador de memoria de 32 bits desactivado, lo que arroja sus 352 bits de bus de memoria. Esto da margen a que Nvidia, en unos meses, presente una ¿Titan RTX? con un TU102 totalmente desbloqueado, con lo que se ganaría en torno a un 6 % más de rendimiento, e incluiría 12 GB de GDDR6.

Por otro lado, Nvidia estaría trabajando en una forma de facilitar el overclocking de sus chips gráficos, y usó la herramienta Precision X1 de EVGA para demostrarlo. Lo que viene a ser la nueva característica es que ajustará las frecuencias y voltajes automáticamente en función del nivel de subida que quiera el usuario, sin que este tenga que hacer nada más. El sistema de alimentación de las GeForce RTX está bastante mejorado, y entre unas cosas y otras se podrá hilar mucho más fino al subir los chips gráficos Turing.

Por último, Nvidia también ha indicado que ha mejorado notablemente el rendimiento de los CUDA en las labores de sombreado —a los CUDA también se les llama sombreadores o shaders por el trabajo que hacen de determinar niveles de iluminación de los píxeles finales durante el rasterizado—, y de hecho la siguiente transparencia indica hasta un 100 % de mejora en herramientas profesional, y en torno al 50 % en diversos juegos. Si la potencia de sombreado aumenta, por tanto aumenta notablemente la potencia final de la tarjeta gráfica. Lo cual ya me encaja más con el 50 % de mejora de rendimiento que indicaba Nvidia de la GTX 1080 a la RTX 2080.

Después de que os habéis tragado todo lo anterior, ahora lo que indicaba en el titular. La compañía dará luz verde a la publicación de los primeros análisis de las GeForce RTX el 14 de septiembre. Aparentemente los que tienen ya sus GeForce RTX no las pueden utilizar porque Nvidia todavía no les ha proporcionado los controladores GeForce actualizados.

nvidia-turing-vs-pascal-shader-performance.jpg