Una startup chiamata Etched ha deciso di uscire allo scoperto dopo un lungo periodo di silenzio, e lo ha fatto con numeri che fanno girare la testa. Più di 400 ingegneri arrivati da colossi come NVIDIA, Google, Broadcom, TSMC e SK Hynix, ottocento milioni di dollari raccolti che in euro fanno circa 740 milioni, e contratti già firmati per oltre un miliardo di dollari, ovvero attorno a 920 milioni di euro. Il prodotto che mette sul tavolo si chiama Frontier Inference Cluster, ed è pensato per far girare i modelli di intelligenza artificiale più pesanti che esistano oggi.
Il messaggio con cui l’azienda ha annunciato il tutto è arrivato il 30 giugno 2026, secco e diretto. Primi rack costruiti, tapeout dell’A0 andato a buon fine, test iniziali con risultati al vertice in fatto di throughput, latenza ed efficienza energetica. E una promessa precisa, le prime unità spedite entro l’estate.
Etched: chip progettati su misura per i modelli più grandi
Il punto di partenza di Etched è semplice da dire e complicatissimo da realizzare. Costruire tutto in casa, dai chip ai rack, dal software fino ai metodi di produzione, per far funzionare al meglio i cosiddetti modelli di frontiera. Si parla di architetture MoE da migliaia di miliardi di parametri, lavori che richiedono contesti lunghissimi e applicazioni di intelligenza artificiale di tipo agentico. Per arrivarci hanno dovuto mettere mano a una lunga lista di componenti, nuovi chip, package, schede, piastre di raffreddamento, interconnessioni.
Il primo pezzo del puzzle è il processore a basso voltaggio, chiamato LVI, pensato per i carichi ad alto throughput. La sua particolarità sta in un’architettura che gli permette di fare calcoli alla metà del voltaggio rispetto alla maggior parte dei chip per l’intelligenza artificiale in circolazione. Un dettaglio tecnico che però risolve un problema concreto e ben noto, quei chip che quando spingono al massimo si surriscaldano e devono rallentare, perdendo più della metà della potenza di picco. Il processore di Etched riesce invece a far girare modelli MoE sparsi da mille miliardi di parametri all’80% dei FLOP di picco senza alcun rallentamento termico.
Memoria ibrida e produzione a ritmi serrati
C’è poi un secondo tassello, la Cluster Scale Memory, dedicata ai lavori che hanno bisogno di latenza bassa. Negli ultimi tempi si è visto uno spostamento verso grandi blocchi di SRAM al posto della classica HBM per velocizzare la fase di decode, ma la SRAM da sola ha i suoi limiti in quanto a capacità e throughput. La soluzione qui è un pool di memoria condiviso, a bassa latenza, che mantiene interconnessioni ad alta banda per accessi più rapidi. Un ibrido tra HBM e SRAM che prova a tenere insieme capacità e velocità, con il vantaggio di costi più contenuti, maggiore affidabilità, rese migliori e un comportamento termico più gestibile.
Il tapeout dell’A0 è stato completato all’inizio di quest’anno sul processo N4P di TSMC, e da allora il team ha lavorato per validare il primo prodotto su scala rack. Tra i finanziamenti raccolti, quattro round mai annunciati prima, figura anche un investimento strategico da parte di VentureTech Alliance. L’azienda sta ampliando le collaborazioni con i principali produttori di semiconduttori e nel frattempo ha costruito un datacenter da 2 megawatt direttamente nei propri uffici, oltre ad aprire una fabbrica a Taiwan che lavora ventiquattro ore su ventiquattro. Altri aggiornamenti su prestazioni e roadmap sono attesi nel corso dell’estate.