Cerebras muestra su enorme chip-oblea que tiene 2.6 billones de transistores

Cerebras es un diseñador de chips para inteligencia artificial que en los últimos años ha dado algunas noticias referente a su motor a escala de oblea (WSE, wafer scale engine) y más recientemente con su segunda versión, WSE2. La característica de este diseño es que toda la oblea de 30 cm es un chip, y la compañía cuenta con un rendimiento de producción del mismo del 100 %. Lo consigue mediante redundancias, y con el paso a los 7 nm en WSE2 ha conseguido duplicar la densidad de transistores hasta los 56.25 M por mm², o un total de 2.6 billones de transistores en la oblea.

Este chip-oblea cuenta con 850 000 núcleos divididos en bloques con redundancias para poder puentear los núcleos que salgan defectuosos en el proceso de fabricación. Esas redundancias se consiguen mediante una malla que los une a todos. Incluye también 40 GB de SRAM, tiene un ancho de banda de memoria de 20 PB/s y la interconexión funciona a 220 Pb/s, por lo que no le falta velocidad en ningún aspecto. El coste de la WSE de primera generación se situaba en los 2-3 millones de dólares, y la de esta segunda generación está por ver cuando se ponga a la venta en el tercer trimestre de este año, aunque la compañía habla de «varios millones».

El equipo que lo incluirá será el CS-2, un equipo de 66 cm de altura de los que entran tres por bastidor en un centro de datos. Incluye todo lo necesario para funcionar, incluyendo además doce conexiones GigabitEthernet, refrigeración líquida, alimentación redundante, ventiladores, y otros elementos. El WSE2 se puede usar con bibliotecas de inteligencia artificial (IA) como TensorFlow y PyTorch, y la compañía se encarga de proporcionar la pasarela de ese código al adecuado para WSE2. Más allá de la IA, con varios centros de supercomputación que ya han adquirido unidades, también está recibiendo la atención de empresas como las petroleras y las energéticas para realizar simulaciones.

Al ser un único chip, la ventaja que tiene es que no hace falta distribuir la carga de trabajo entre múltiples chips como por ejemplo el de tarjetas gráficas, por lo que simplifica el desarrollo de código. Con la cantidad de memoria y la conectividad que tiene, tampoco hay problemas a solucionar con el tamaño de memoria, ancho de banda y otros. Todo se hace de manera casi transparente desde la propia WSE2.

Vía: AnandTech.