DeepSeek AI ha catturato l’attenzione del mondo tech quest’anno con una mossa che ha lasciato molti a bocca aperta: creare un modello linguistico potente senza spendere cifre astronomiche. Il suo segreto è emerso in uno studio pubblicato su Nature, dove il team ha rivelato di aver addestrato il modello R1 con appena 294.000 dollari e 512 chip Nvidia H800, un budget irrisorio se paragonato a quello dei colossi occidentali come OpenAI.
Un’AI a basso costo che compete con OpenAI: il caso DeepSeek R1
Ciò che rende R1 così efficiente è un approccio di apprendimento per rinforzo basato sul trial & error. Piuttosto che affidarsi a costosi dataset annotati da esseri umani, il modello viene guidato da un sistema di punteggio: risposte corrette ricevono un voto alto, quelle sbagliate un punteggio basso. In pratica, il modello “impara giocando”, simile a un bambino che sperimenta in un videogioco fino a capire quale mossa funziona. Questo metodo si è rivelato particolarmente efficace per problemi oggettivi, come la matematica e la programmazione, dove le risposte giuste sono verificabili senza ambiguità.
Il trial & error, però, ha i suoi limiti. Il processo di ragionamento di R1 rimane opaco e difficile da seguire. Quando si prova a fargli spiegare i passaggi, spesso il modello produce testi lunghissimi o mescola lingue diverse, passando dall’inglese al cinese senza preavviso. Inoltre, quando si tratta di domande soggettive o di contesti che richiedono sfumature, l’approccio perde efficacia, mostrando che la semplicità dei dati e la velocità di addestramento comportano compromessi nella comprensione profonda.
Accanto alla tecnica innovativa, resta il dibattito sul contesto geopolitico. DeepSeek mantiene legami stretti con il governo cinese e il modello stesso è programmato per rifiutare richieste considerate sensibili o potenzialmente rischiose secondo le linee guida di Pechino, come evidenziato in un recente report del Washington Post. Questo solleva interrogativi su etica e libertà di utilizzo, che non possono essere ignorati nonostante i risultati impressionanti.
Il caso di R1 mostra come sia possibile competere a livello globale anche con risorse limitate, grazie a strategie di addestramento intelligenti e innovative. Allo stesso tempo, sottolinea quanto la tecnologia non possa essere disgiunta dal contesto in cui nasce e opera, ricordando che l’efficienza e la potenza di un’intelligenza artificiale sono sempre intrecciate a dinamiche economiche, politiche e sociali che ne influenzano l’impatto reale.
