Hay mucha expectación por que el mercado de las tarjetas gráficas tenga un tercer competidor, porque cuanto más competencia haya mejor para todos. Esta última es una frase manida, pero es que la dejadez de AMD ante la preponderancia de Nvidia es notoria y ahora mismo sigue yendo a remolque. Por eso que Intel entre en este sector de las unidades de procesamiento gráfico (GPU) dedicadas me resulta tan interesante, y Raja Koduri, por si lo echabais de menos, ha presentado muchos jugosos detalles de la arquitectura Xe.

La siguiente información es específicamente de la Xe-LP, que finalmente no solo se usará en las unidades gráficas integradas en los Tiger Lake sino que habrá algunas GPU dedicadas con ella, tanto para el sector de los portátiles (DG1) para jugones como para centros de datos (SG1). Toda la información ha sido proporcionada por Intel en su Día de Arquitectura 2020, que es uno de esos días en los que da un poco de información de todo. También ha hablado de los Tiger Lake y alguna cosilla más, pero he preferido empezar hablando de la Xe.

intel-3_08.jpg

Lo primero a hablar de esta unidad gráfica es que Intel mantiene la estructura general, con la misma denominación de 'fragmento' (slice) a una unidad autónoma de generación gráfica, y en esta ocasión está compuesta de seis subfragmentos (subslices) en lugar de ocho, duplicando diversos valores de la misma. Cada subfragmento está compuesto de dieciséis unidades de ejecución, y cada una de ellas está compuesta por una región dedicada a cálculos de coma flotante y enteros, y la otra a cálculos matemáticos avanzados a la que se refiere como «matemáticas avanzadas».

Cada zona es capaz de ejecutar una urdimbre de ocho hilos en paralelo (SIMD8, ocho unidades aritmético-lógicas) con operaciones de coma flotante y enteros, en una gran reorganización interna para ganar rendimiento, unificando lo que antes era dos SIMD4, pero le añade una SIMD2 extra para operaciones matemáticas avanzadas, aliviando ese peso de la SIMD8 principal. Está un poco lejos de las urdimbres de Nvidia y AMD —las llaman warps o wavefronts según la nomenclatura de cada una, ARM también usa esta última, pero son lo mismo, agrupaciones de hilos, o urdimbres— que son de 32 o 64 hilos, pero es más que los cuatro hilos que ejecutaba simultáneamente la arquitectura gráfica previa de Intel.

Resumido en cristiano, lo que quiere decir esto es que cada unidad de ejecución está compuesta por ocho «sombreadores», por lo que el fragmento Xe tiene un total de 768 sombreadores por sus 96 unidades de ejecución. Lo que no cambia es el frontal del chip —la zona de acceso al chip desde el exterior—, con un solo distribuidor de geometría, rasterizado y pixelización, pero duplica su tasa de trabajo. Sí cambia dentro de cada subfragmento la caché de datos de nivel 1, pasando a 64 KB por subfragmento.

intel-3_21.jpg

No se menciona que haya caché de nivel 2, pero la caché de nivel 3 sigue estando integrada en el frontal del chip, pero puede ser de hasta 16 MB frente a solo 3 MB como ocurría en la gen. 11 gráfica. Intel jugará con ello según la orientación del chip: integrada, dedicada o centros de datos. Hay cambios en el acceso a la memoria gráfica, apuntando a que el chip DG1 usará 128 bits que es el máximo que tiene el diseño de Intel para el Xe-LP. La integrada tiene acceso a memoria LPDDR4 y LPDDR5-5200, por lo que va avanza bastante frente a la LPDDR4X-3733 de los Tiger Lake —un 39.2 % para ser preciso, lo que beneficia enormemente a las unidades gráficas integradas—.

Un punto importante de este cambio de chip, junto con el proceso litográfico de 10 nm, es que aumentarán sustancialmente las frecuencias de funcionamiento hasta quizás los 1500-1600 MHz frente a los 1150 MHz actuales. Unido al 50 % más de sombreadores y otras optimizaciones en la tubería de generación gráfica, se duplica la potencia de cómputo total, probablemente hacia los 2.3 TFLOPS, que es la potencia de cómputo que tiene una tarjeta gráfica como la RX 560. Y eso siendo una unidad gráfica integrada, por lo que no está nada mal. Pero además Intel ha implementado operaciones INT8, que son altamente usadas en inteligencia artificial, y en ello la potencia de esta nueva GPU va a destacar y es por lo que va a haber una versión para centros de datos.

intel-3_23.jpg

Otros elementos que Intel ha tocado en la GPU es, como no puede ser de otra forma, todo lo relacionado con señales de vídeo. Incluyo en ello los códecs que implementa de estándares de compresión como AV1 y HEVC, y en este caso el Xe-LP es capaz de reproducir vídeo a 8K y 60 Hz, con un color de 12 bits, compatible con HDR10/Dolby Vision. Las conexiones de vídeo pueden ser DisplayPort 1.4 y HDMI 2.0, ya sea sobre Thunderbolt 3, USB4 u otros. Implementa Adaptive Sync, por lo que el apartado del refresco adaptable está asegurado, compatible con los monitores FreeSync de hasta 360 Hz, como no podía ser de otra forma en 2020.

Vía: AnandTech.