NVIDIA presentará en el tercer trimestre la arquitectura Ada para las próximas GeForce RTX 40 y además de añadir más CUDA a los chips serie AD100 también haría modificaciones a su configuración de memoria. Estaría además relacionado con los posibles cambios a la caché de nivel 2 que haría la compañía porque podría aumentarla enormemente. Pero voy a ir por partes.

El chip AD102 se quedaría con doce chips de memoria con bus de 32 bits para un total de 384 bits como tiene ahora el GA102, para tener 12 GB o 24 GB de VRAM. El AD103 frente al GA103 mantendría ocho chips de memoria y un bus de 256 bits, y por tanto 8 GB o 16 GB de VRAM, dependiendo de si se usan chips de 1 GB o 2 GB.

Ahora empezarían los cambios a peor, por lo que habría que cogerlo con una buena dosis de escepticismo. El chip AD104 pasaría a tener solo seis chips de memoria y un bus de 192 bits, lo que permitiría conformar tarjetas gráficas con 6 GB o 12 GB de VRAM. Esto a la postre también recortaría el ancho de banda de memoria, pero de eso hablaré en un momento.

El chip AD106 bajaría de ocho chips a cuatro chips para tener 4 GB u 8 GB de VRAM y un bus de 128 bits, frente a los seis chips del GA106. El AD107 se quedaría igual, con cuatro chips para un bus de 128 bits y la posibilidad de tener 4 GB u 8 GB de VRAM.

Sobre el bus, el ancho de banda y la caché

El tema del bus de memoria determina el ancho de banda de la memoria. Que en el chip AD104, que conformaría la «RTX 4070» porque el GA104 conforma ahora mismo la RTX 3070, se baje el bus significa que se merma el ancho de banda de memoria. Usando GDDR6 a 14 Gb/s, pasaría de 448 GB/s a 336 GB/s. Si usara memoria a 18 Gb/s, que sería lo razonable, podría alcanzar los 432 GB/s, por lo que no perdería casi ancho de banda. El problema estaría en que al aumentar también los CUDA, de 6144 a 7680, se necesita más ancho de banda para mantenerlos siempre en funcionamiento.

Las arquitecturas de NVIDIA han estado siempre limitadas por la memoria usada, por lo que cualquier cambio en la configuración podría producir un efecto en cascada en toda la alineación de RTX 40. Es donde entraría en juego la caché de nivel 2 mejorada. En la arquitectura Ampère está ligada a los controladores de memoria, por lo que cualquier aumento en la caché de N2 beneficiará notablemente al ancho de banda. Si puede mantener más información en la caché se evita ir al controlador de memoria para ir a la VRAM a buscar la información que se necesita.

El problema que le veo es que al aumentar tanto el tamaño de la caché de N2 se producen dos efectos adicionales: se aumenta de manera exponencial y no lineal el espacio que ocupa, y se aumenta la latencia de la propia caché. Si hay más posiciones de memoria entre las que buscar la información que se necesita, se tarda más tiempo en encontrarla.

Cambios razonables

Veo factibles los cambios que se están rumoreando, tanto de configuración de bus de memoria, porque sería un cambio más natural en la configuración de memoria de las tarjetas gráficas, como de la caché. Ahora mismo tienes una RTX 3060 con 12 GB y luego una RTX 3070 bastante más potente con solo 8 GB, lo cual no tiene mucha lógica. En cuanto a la caché, sería una forma de reducir la dependencia del ancho de banda.

Pero uniendo todo ello, puede que al final el tema de la memoria de las RTX 40 no mejore mucho sobre todo si aumenta mucho la latencia de la caché de nivel 2. Sería el habitual equilibrismo entre ancho de banda y latencias que también se practica en las CPU. Eso sí, siempre que sean ciertos estos rumores, aunque en primera instancia tienen cierta lógica y combinan bien entre ellos, po coherencia con la forma en que NVIDIA podría evolucionar los chips.

Vía: TechPowerUp.