D-Matrix ha deciso di prendere una strada diversa per insidiare il dominio di NVIDIA nel mondo dell’Intelligenza Artificiale, e lo fa partendo da un punto preciso anziché provare a competere su tutto. La startup californiana, che tra i suoi sostenitori finanziari conta Microsoft, ha appena avviato la produzione commerciale del suo chip Corsair, pensato fin dall’inizio per un compito specifico: l’inferenza. L’azienda parla di prestazioni che in certi scenari arrivano a essere dieci volte superiori rispetto a una GPU classica, il tutto con consumi energetici molto più bassi.
Il momento del lancio non è casuale. La richiesta globale di acceleratori per l’AI sta crescendo più in fretta di quanto le fabbriche riescano a produrne, soprattutto quando si parla della memoria avanzata che i sistemi NVIDIA pretendono. In mezzo a questa corsa affannata, qualcuno che propone un’alternativa trova orecchie pronte ad ascoltare.
Una nicchia precisa per evitare lo scontro frontale
Qui sta il punto interessante: D-Matrix non vuole rimpiazzare le GPU usate per addestrare i grandi modelli linguistici. Ha scelto di puntare tutto sull’inferenza AI, cioè quella fase in cui un modello già addestrato lavora davvero, genera risposte, analizza dati, produce contenuti. È la parte che diventerà sempre più centrale man mano che gli agenti AI e le applicazioni generative entrano nella vita quotidiana delle aziende.
Secondo il fondatore e amministratore delegato Sid Sheth, il mercato dell’inferenza potrebbe avvicinarsi nei prossimi anni ai mille miliardi di dollari. Numeri da capogiro, che spiegano la strategia: occupare un angolo molto specializzato invece di affrontare NVIDIA sul terreno dove il gruppo di Jensen Huang ha un vantaggio tecnologico e industriale che, oggi, sembra quasi impossibile da colmare.
Memoria nel chip e numeri dichiarati
La vera carta da giocare di Corsair riguarda la memoria. Buona parte dell’industria AI dipende dai moduli DRAM ad alta larghezza di banda, una risorsa che negli ultimi tempi è diventata scarsa e costosa. D-Matrix ha cambiato approccio: ha integrato grandi quantità di memoria direttamente dentro il chip, riducendo così la necessità di andare a pescare continuamente da componenti esterni e tagliando la latenza nelle operazioni di inferenza.
I numeri che l’azienda mette sul tavolo sono notevoli. Corsair, dicono, può eseguire certi carichi di lavoro fino a dieci volte più rapidamente di una GPU NVIDIA tradizionale, consumando fino a cinque volte meno energia. Con un’avvertenza importante, però: questi risultati valgono per scenari specifici, con modelli relativamente contenuti. Sui modelli giganteschi, quelli che richiedono enormi quantità di memoria e calcolo parallelo, le GPU restano più flessibili.
L’idea richiama strade già battute da realtà come Cerebras e Groq, che hanno provato a superare i limiti delle GPU classiche con architetture pensate in modo radicalmente diverso.
Microsoft, i soldi raccolti e la vera sfida
Tra gli investitori, come detto, c’è Microsoft. Il colosso di Redmond da anni cerca di diversificare la filiera hardware dei suoi data center, per non restare appeso a un numero ristretto di fornitori. La startup ha raccolto circa 430 milioni di euro, arrivando a una valutazione vicina ai 1,7 miliardi di euro.
L’avvio della produzione commerciale di Corsair segna il salto dalla fase di ricerca a quella di mercato vero. E la partita più dura non sarà vincere qualche benchmark scelto con cura. Sarà convincere clienti e sviluppatori a costruire software ottimizzati per una piattaforma alternativa, abbandonando l’ecosistema NVIDIA, che resta lo standard dominante in tutto il settore.