La corsa all’intelligenza artificiale ha rimescolato le priorità di chi progetta hardware, e adesso succede una cosa che fino a poco tempo fa sembrava quasi controintuitiva. Per anni le luci dei riflettori erano puntate solo sulle GPU, ma ora AMD e Intel tornano a guardare con interesse alle CPU, soprattutto quando serve eseguire in locale modelli più piccoli e la bassa latenza conta più della potenza bruta di calcolo. Praticamente tutti i processori recenti includono ormai una NPU sempre più capace, e adesso i due colossi hanno deciso di unire le forze per spingere l’idea ancora più avanti.
Dal coordinatore alla forza bruta, come cambia il ruolo della CPU
Nessun computer moderno può funzionare senza una CPU, eppure per lungo tempo il processore è stato relegato a un ruolo quasi da regista, mentre alle GPU spettava il lavoro pesante, quello di macinare la stragrande maggioranza dei calcoli. Poi è arrivata la NPU, ovvero la Neural Processing Unit, e le cose sono cambiate. Si tratta di chiplet iperspecializzati nelle moltiplicazioni di matrici, quelle operazioni matematiche che i modelli AI sfruttano nella fase di inferenza, cioè quando vengono interrogati dall’utente e producono le risposte.
L’iniziativa congiunta delle due aziende ha un nome preciso, ACE, sigla che sta per Advanced Compute Extensions, e in sostanza punta a portare le NPU dentro la CPU. Il vantaggio è concreto. Non serve più spostare continuamente dati tra processore e scheda grafica, e questo significa meno tempi di attesa, consumi energetici più contenuti e una pipeline di elaborazione complessivamente più snella.
Cosa promette ACE sul fronte prestazioni
Stando alle informazioni disponibili, ACE potrebbe far crescere parecchio il numero di operazioni eseguite per istruzione rispetto alle attuali implementazioni AVX10. Attenzione però, non vuol dire che le prestazioni reali aumenteranno nella stessa misura. Quello che emerge è piuttosto un uso più intelligente delle risorse hardware e, di riflesso, una probabile riduzione dei consumi.
La specifica, tra l’altro, supporta diversi formati numerici impiegati nell’intelligenza artificiale, tra cui INT8, INT32, FP8, FP16, FP32 e BF16, oltre ai formati MX promossi dall’Open Compute Project. Una flessibilità che lascia intendere quanto il progetto guardi lontano.
Prima di vedere queste estensioni dentro CPU x86 vere e proprie, però, ci vorrà ancora del tempo. Al momento siamo fermi al livello della documentazione tecnica e dell’ufficializzazione delle specifiche, quindi parliamo di qualcosa che esiste sulla carta ma non ancora nei chip che finiscono nei nostri computer.