Alibaba ha deciso di smettere di affidarsi alle tecnologie di Nvidia per la sua infrastruttura di intelligenza artificiale, e lo sta facendo con un piano che ha tutta l’aria di voler ribaltare gli equilibri del settore. La spinta arriva da lontano: il governo di Xi Jinping aveva chiesto già all’inizio di ottobre 2024 alle grandi aziende tecnologiche cinesi di usare, dove possibile, chip prodotti in Cina. Dieci mesi più tardi quella raccomandazione si è trasformata in un obbligo vero e proprio.
Una richiesta che è diventata un’esigenza
Il punto è che i data center statali sparsi per il Paese devono ora montare almeno il 50% di circuiti integrati cinesi nei loro server. Una mossa che gioca a favore soprattutto di Huawei, Moore Threads e Cambricon Technologies, i principali produttori di GPU per IA in Cina. Ma fa comodo anche ad Alibaba, e parecchio. La sua divisione di cloud computing, Alibaba Cloud, ha fatto un passo avanti niente male.
Pochi giorni fa ha presentato un nuovo chip per intelligenza artificiale, lo Zhenwu M890, accompagnandolo con una tabella di marcia parecchio ambiziosa che racconta cosa l’azienda intende sviluppare nei prossimi tre anni. Questa GPU è stata progettata da T-Head, la divisione di semiconduttori che Alibaba ha fondato nel 2018. A bordo ci sono 144 GB di memoria HBM3 e una velocità di trasferimento nell’interconnessione tra chip che arriva fino a 800 GB/s. E proprio quest’ultima caratteristica, come vedremo, è il cuore della strategia messa a punto dal colosso cinese.
Cinquantatré miliardi di dollari sul piatto
Secondo Alibaba, le prestazioni dello Zhenwu M890 triplicano quelle del modello che lo ha preceduto. È stato pensato per rendere bene sia durante l’addestramento dei modelli di IA di ultima generazione sia durante l’inferenza, ossia quel processo che i modelli linguistici eseguono per generare le risposte alle richieste che ricevono.
C’è poi un dato che vale la pena tenere d’occhio: nelle operazioni a precisione media (FP16) il chip raggiunge 0,6 petaflops, un risultato paragonabile a quello della GPU A100 di Nvidia e tre volte superiore al chip H20. Non solo. Il chip di interconnessione ICN Switch consente di collegare fino a 128 GPU M890 perché lavorino all’unisono. Alibaba sostiene che questa architettura faccia funzionare le GPU come se fossero un unico chip, e sulla carta è proprio questo che le permetterebbe di sfidare Nvidia ad armi pari nel dispiegamento di infrastrutture per i data center.
Guardando avanti, l’azienda ha anticipato i prossimi passi fino al 2028. Lo Zhenwu V900 dovrebbe arrivare nel terzo trimestre del 2027, con un’architettura di calcolo parallelo proprietaria nettamente migliorata, prestazioni triplicate rispetto all’M890, 216 GB di memoria e una velocità di trasferimento nell’interconnessione di 1.200 GB/s. Poi toccherà allo Zhenwu J900, atteso per il terzo trimestre del 2028, con un salto architettonico ancora più marcato.
La roadmap racconta di un’azienda che ci sta mettendo tutto. A sostenere il piano c’è un investimento in infrastruttura da 380.000 milioni di yuan, circa 49 miliardi di euro, spalmato sui prossimi tre anni: il più grande impegno di questo tipo nella storia della compagnia. T-Head, intanto, sta preparando la quotazione in borsa per finanziare un programma ancora più aggressivo, una mossa che la metterebbe in concorrenza diretta con Cambricon Technologies e con la linea Ascend di Huawei nel mercato interno dei chip per IA.