DeepSeek R2: il ritardo dipende anche dai chip Huawei?

Il percorso di sviluppo di DeepSeek R2 ha incontrato un ostacolo inaspettato. Quest'ultimo è frutto non tanto di limiti tecnologici iniziali quanto di una scelta politica che ha generato conseguenze tecniche considerevoli. Come riportato dal Financial Times, le autorità di Pechino hanno imposto alla società di ridurre la dipendenza dall’estero e di rinunciare all’utilizzo delle GPU Nvidia. Sostituendole con processori prodotti in patria da Huawei. L’intento era rafforzare l’autonomia tecnologica cinese. Eppure, la realtà si è dimostrata meno lineare del previsto. Le piattaforme basate sull’architettura Ascend, cuore dell’offerta Huawei, hanno mostrato limiti non trascurabili. Tra cui performance poco affidabili, una velocità di interconnessione ridotta e problemi legati al software CANN. Elementi che hanno finito per frenare l’addestramento del nuovo modello. DeepSeek R2 in ritardo: ecco i dettagli Il precedente progetto, il modello R1, aveva destato grande interesse a inizio anno grazie al sorprendente rapporto tra costi e potenza di calcolo. Secondo le dichiarazioni ufficiali, l’addestramento era stato portato avanti con 2.048 Nvidia H800 e con un budget di circa 5,6 milioni di euro. Una cifra irrisoria se confrontata con i colossi del settore. In realtà, l’azienda aveva a disposizione un arsenale ben più ampio, che includeva circa 50.000 GPU della famiglia Hopper. Diecimila H800, altrettante H100 e trentamila HGX H20. Per R2 si era scelto un approccio radicale, con il passaggio completo all’hardware Huawei sia in fase di addestramento che in quella di inferenza. I problemi emersi, però, hanno reso necessario un compromesso. L’uso delle Nvidia per l’addestramento e il mantenimento delle Ascend soltanto per la fase successiva. Nemmeno la presenza di squadre di ingegneri Huawei presso i data center di DeepSeek è riuscita a colmare le lacune. E finora nessun ciclo di addestramento completo è stato portato a termine esclusivamente su Ascend. Tale rallentamento ha fatto rimandare la data di lancio. Quest'ultima, prevista per maggio, è ora attesa nel giro di poche settimane. La situazione è ulteriormente complicata dalla scarsità di GPU di fascia alta disponibili in Cina. Un problema amplificato dalle restrizioni imposte da Washington. All’inizio di agosto, gli Stati Uniti hanno raggiunto un’intesa con Nvidia e AMD. Le due aziende potranno continuare a vendere chip per l’intelligenza artificiale sul mercato cinese. Ciò a patto di cedere al governo americano il 15% dei ricavi, inclusi quelli derivanti dalle H20.

DeepSeek R2: il ritardo dipende anche dai chip Huawei?

Sembra che DeepSeek R2 sia in ritardo. Secondo recenti indiscrezioni i chip Huawei non supportano l’addestramento.

DeepSeek R2 in ritardo: ecco i dettagli