Intel desgrana la arquitectura Xe-HPG, las GPU se producirán en el nodo de 6 nm de TSMC

Intel pondrá a la venta en el primer trimestres de 2022 las tarjetas gráficas ARC que integrarán una unidad gráfica Alchemist basada en la arquitectura Xe-HPG y ahora la compañía ha dado más detalles de la arquitectura en sí. No había dado más que algunos pequeños detalles pero ahora ha mostrado hasta un esquema de bloques de la GPU. La información ha sido dada en el Día de Arquitectura 2021 que ha celebrado Intel, y las transparencias de esta parte de la presentación las tenéis al final del artículo.

La unidad básica de la arquitectura es el núcleo Xe —deja atrás las unidades de ejecución como se venían llamando hasta ahora— que está compuesto por 16 motores vectoriales que procesan 256 bits cada uno por ciclo y 16 motores matriciales —por no llamarlas «tensoriales» como NVIDIA— de 1024 bits cada uno por ciclo. El núcleo Xe tiene las debidas unidades de carga/guardado, sus cachés de instrucciones de nivel cero y de nivel uno. Cada núcleo Xe es capaz de procesar 128 operaciones FP32 por ciclo, que es lo mismo que puede procesar la arquitectura Ampère de NVIDIA. Entended con ello que cada núcleo Xe es como un multiprocesador de flujos de datos (SM) de NVIDIA los cuales tienen 128 núcleos CUDA (FP32) cada uno.

Cada núcleo es acompañado por una unidad de trazado de rayos y un muestreador. Las unidades de trazado de rayos pueden realizar el recorrido de los rayos, intersecciones de bordes de objetos e intersecciones de triángulos.

intel-architecture-day-2021-presentation_pages-to-jpg-0102.jpg

Cuatro de estos núcleos Xe conforman un fragmento de renderizado (render slice) que integra las debidas unidades de geometría, rasterizado y generación de píxeles. O sea, son de «512 núcleos CUDA» por continuar la analogía con Ampère. Está todo optimizado para DX12 Ultimate. Uno de estos fragmentos de renderizado debe ser acompañado de un distribuidor global de carga de trabajo—global dispatcher, pero no uséis el falso amigo 'despachador' aunque lo ponga en Google porque no es un charcutero repartiendo chorizo— así como de una caché de nivel 2 y una interconexión con la memoria. Se han dejado fuera de las transparencias toda la parte de unidades aritméticas, gestor de vídeo, etc., porque no es de lo que quería hablar hoy la compañía.

El tamaño del distribuidor, caché e interconexión dependerá del número de fragmentos de renderizado presentes en la GPU, pero según Intel estas escalan a la perfección. Una GPU tipo Alchemist puede tener hasta ocho fragmentos con un tamaño superior de caché y un distribuidor de carga entre todos ellos. Esos ocho fragmentos serían como 4096 núcleos CUDA de NVIDIA, que no sé si es la idea que quería dar Intel con esa transparencia. Una RTX 3060 tiene 3584 núcleos CUDA y una RTX 3070 cerca de 5900, pero en realidad la potencia dependería del rendimiento por «núcleo» de la arquitectura de Intel.

La ventaja de Xe-HPG es que aporta un 50 % más de rendimiento por vatio fretne a Xe-LP lo cual es muy necesario para este tipo de unidades gráficas de alto rendimiento. Es en el más puro estilo AMD, que es en lo que se está centrando la compañía roja. Estas GPU además se beneficiarán del proceso de fabricación de 6 nm de TSMC que es el que ha elegido Intel para fabricar las unidades gráficas Alchemist. TSMC ha indicado que está muy contenta de la oportunidad de colaborar con Intel en sus GPU dedicadas.