Apple se introdujo en los módulos multichip con el procesador M1 Ultra el cual une en un mismo encapsulado dos chips de los que conforman el M1 Max. La interconexión entre ambos la ha denominado UltraFusion, y aunque Apple dejó claro que era la unión directa de ambos chips, hubo gente que no lo entendió y empezó a elucubrar que fuera el sistema CoWoS de TSMC o uno similar. En un mundo de siglas es fácil perderse, pero para eso están los buscadores. TSMC ha venido a arrojar luz sobre UltraFusion.

CoWoS significa «chip sobre oblea sobre substrato», que no es lo que Apple anunció. En su lugar, TSMC ha usado otro tipo de encapsulamiento que es interconexión directas entre chips llamado InFO que es «ramificaciones integradas» (integrated fan-out). Una ramificación es una forma de extender las salidas más allá de la planta del propio chip por diversos métodos —por ejemplo, un material epoxi— para facilitar su encapsulado con otros chips.

InFO es un grupo de técnicas, y específicamente con el M1 Ultra se ha usado la InFO_LI (ramificaciones integradas con interconexión local , InFO with local interconnect), junto con una capa de redistribución (RDL). La diferencia con respecto a CoWoS no es trivial porque esto usa interconexiones creadas en el punto en lugar de tener que recurrir a un intermediador para realizar la unión de los chips.

wisvbz9y2soatpmavddok3-970-80.png.webp

Un intermediador es más grande aunque más barato, pero introduce retardos adicionales. Aun así, una interconexión local como la UltraFusion con el proceso de fabricación de 5 nm de los chips huele a muy caro y proclive a sufrir fallos, que explicaría el excesivo coste del Mac Studio con el M1 Ultra —más allá de que sea un producto de Apple—.

Aquí hay que sacar a colación que los dos chips M1 Max usados para crear el M1 Ultra funcionan en una arquitectura de «acceso a memoria no unificado» (NUMA), que lo recordaréis de los primeros Threadripper y que era una fuente de latencia adicional. No importa tanto en tareas netamente profesionales, pero afecta mucho a los juegos. Como los Threadripper, el M1 Ultra oculta que usa NUMA al sistema operativo y por tanto se ve como si fuera un único procesador.

Pero como cualquiera de los dos chips puede acceder a su propia memoria o a la del otro chip, el paso por esa interconexión UltraFusion añadirá latencia adicional por muy rápida que sea la interconexión. Apple habla de 2.5 TB/s, que en realidad es una burrada y solo InFO_LI puede proporcionarla. No he visto por el momento que se haya probado cuánta es esa latencia adicional, pero quizás ni siquiera se pueda llegar a probar.

zcvceowsgfujpvoajh2qqa-970-80.png

Vía: Tom's Hardware.