Il panorama dell’intelligenza artificiale potrebbe presto essere scosso da un nuovo protagonista: DeepSeek R2. Dopo il grande successo ottenuto con il modello R1, particolarmente apprezzato per l’efficienza e il basso consumo di risorse hardware, l’azienda cinese sembra pronta a lanciare il suo nuovo modello. Sebbene la data esatta del debutto non sia ancora chiara, i primi rumor provenienti dalla Cina lasciano intravedere novità molto rilevanti.

Le indiscrezioni suggeriscono che DeepSeek R2 adotterà una architettura MoE (Mixture of Experts) ibrida, evoluzione della tecnologia già vista su R1. Ma il vero salto di qualità si intravede nei numeri: il nuovo modello dovrebbe raggiungere 1.200 miliardi di parametri, raddoppiando di fatto quelli del suo predecessore. Si prevede inoltre un abbattimento drastico dei costi per token, con una riduzione stimata del 97,2% rispetto a GPT-4: si parla di soli 0,07 dollari per milione di token in input e 0,27 dollari per milione in output.

La sfida hardware: Huawei protagonista

Un altro elemento particolarmente interessante riguarda l’infrastruttura hardware che supporterà DeepSeek R2. Il nuovo modello andrà a occupare l’82% del cluster di chip Huawei Ascend 910B, sfruttando una potenza di elaborazione pari a 512 PetaFLOPs con precisione FP16. Una scelta significativa che conferma l’intenzione di DeepSeek di affidarsi a fornitori nazionali, riducendo la dipendenza da player occidentali come NVIDIA.

La collaborazione con Huawei, tuttavia, apre anche scenari complessi. Recenti indagini suggeriscono che Huawei avrebbe utilizzato un’azienda intermediaria per continuare a ottenere chip prodotti da TSMC, nonostante il Ban imposto dagli Stati Uniti. Una situazione che potrebbe avere ripercussioni importanti sul mercato globale dei semiconduttori e sull’equilibrio delle forze nell’ambito dell’AI.

Con queste premesse, DeepSeek R2 si prepara a essere uno dei modelli più innovativi e discussi del 2025, pronto a mettere nuovamente in difficoltà i colossi occidentali. Il regno dei grandi, come ChatGPT e Gemini, potrebbe dunque subire una grossa minaccia da parte di questa realtà.