NVIDIA detalla el funcionamiento DLSS 3, una gran mejora frente a DLSS 2

Con la cantidad de información que ha dado NVIDIA en la última GTC de este año hemos tenido que expandir la información en una buena cantidad de artículos, y solo hemos cubierto lo relacionado con las RTX serie 40. Me falta hablar de dos cosas: DLSS 3 y de la arquitectura Ada en sí. Sobre lo último estoy esperando a que haya información completa, aunque hasta que no se publique el libro blanco de la arquitectura Ada solo se podrán comentar generalidades.

Mientras, me voy a centrar en DLSS 3 porque me parece especialmente interesante. Es la tercera generación del supermuetreo por inteligencia artificial. Hasta ahora venía usando un escalado espacial en DLSS 2 en base a vectores de movimiento de fotogramas anteriores, junto a un supermuestreo que le permite funcionar como un suavizado de bordes avanzado. XeSS de Intel y el FSR 2 de AMD funcionan de manera similar, en el segundo caso sin usar unidades específicas de IA como usan Intel y NVIDIA.

Esta tercera versión añade más complejidad al asunto gracias a la nueva generación de núcleos tensoriales. La arquitectura Ada incluye un acelerador de flujo óptico mejorado para DLSS que alimenta a la red neuronal usada hasta ahora de DLSS 2 con información de fotogramas posteriores, con lo cual es capaz de producir fotogramas directamente en la GPU sin que se implique la CPU. Esto permite desahogarla y por lo menos duplicar el rendimiento frente a DLSS 2 en escenarios donde la CPU limite el rendimiento de la tarjeta gráfica. En algunos juegos el efecto será mucho mayor.

El sistema lo ha definido NVIDIA como un «autocodificador por convolución de generación de fotogramas de DLSS», y al leer «convolución» me dan escalofríos como a cualquier ingeniero que haya estudiado sistemas lineales. Usando esos términos ingenieriles, se podría reducir a que con la información previa de DLSS 2 y la nueva en base a fotogramas futuros, el sistema de convolución interpola fotogramas intermedios en función de cómo van a ser los píxeles del siguiente fotograma y los muestra por pantalla sin intervención más que de las unidades tensoriales —y un poco de los sombreadores—.

geforce-rtx-40-series-nvidia-dlss3-performance-chart.png

El acelerador de flujo óptico analiza dos fotogramas secuenciales para calcular un campo de flujo óptico. Eso de «óptico» viene a decir que además de la dirección de los vectores de movimiento de la geometría (objetos) de la escena también analiza la velocidad de los objetos para tenerla en cuenta a la hora de interpolar los píxeles de los fotogramas subsiguientes. Es capaz de extraer la información a nivel de píxel, consiguiéndola tanto de objetos grandes como de partículas tipo humo, o de la iluminación y reflejos. Según NVIDIA, si se analizara el movimiento de los píxeles sin el analizador de flujo óptico, se producirían anomalías visuales como sombras dobles.

En las imágenes de más abajo se puede ver lo que interpreta este acelerador en forma de sentido y velocidad de los píxeles de las dos imágenes analizadas de un motero. Con toda la información que necesita DLSS 3 se crean fotogramas intermedios. De cada dos fotogramas solo una pequeña cantidad de los píxeles mostrados han sido realmente generados por los sombreadores de la tarjeta gráfica. Este sistema es compatible con Reflex, por lo que también permitirá una menor latencia de entrada en los juegos.

Como ya he indicado en otra noticia, DLSS 3 empezará a estar disponible el 12 de octubre y llegará en breve a 35 juegos y programas.