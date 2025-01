Viviamo in un mondo dove ormai l’intelligenza artificiale è diventata un’elemento comune a tutti noi. Ormai la possiamo trovare in ogni cosa che riguarda l’informatica. Una in precisione che sta tentando la scalata è DeepSeek.

Una nuova tipologia che si unisce al grande elenco delle IA, la quale sembra riportare delle fantastiche prestazioni.

DeepSeek, una delle migliori?

Come già anticipato recentemente, mentre le più grandi AI continuano nel loro cammino, abbiamo molti altri modelli che nascono e continuano a crescere. Parliamo di una piccola startup cinese che tramite lo sviluppo di un modello sembra portare e superare in termini di prestazioni i giganti del settore.

Quest’ultima prende il nome di DeepSeek V3, ovvero un Large Language Model con 671 miliardi di parametri e addestrato in due mesi con un investimento di 5,58 milioni di dollari. Un dato molto interessante è che questa nuova IA è riuscita ad ottenere strabilianti risultati. Il tutto con delle risorse di calcolo inferiori rispetto i modello più conosciuti.

Per raggiungere questo traguardo DeepSeek ha puntato tutto su una nuova architettura progettata per un addestramento molto efficiente in termini di costi. Quest’ultima ha utilizzato 2,78 milioni di ore di GPU per poter addestrare il modello V3, mentre Meta per il suo modello ha impiegato 30,8 milioni ore di GPU.

A quanto pare i risultati dei benchmark confermano che DeepSeek V3 riesce a superare numerose tipologie di IA in vari test, che vanno a valutare le capacità di un sistema di IA in varie aree. Tra queste abbiamo la comprensione e la generazione del testo e molto altro ancora.

Oltre a questo DeepSeek V3, ha riscontrato dei risultati molto simili a quelli di GPT-4 di OpenAI e Claude 3.5 Sonnet di Anthropic.

DeepSeek viene fondata a luglio 2023 da High-Flyer Quant, ovvero una società che va ad utilizzare l’AI per poter gestire uno dei più grandi hedge quantitativi in Cina. L’obiettivo impostato è quello di poter creare un’AI utile all’umanità.