Il chip NVIDIA GB300 ha messo a segno un risultato che difficilmente passa inosservato, dominando i carichi di lavoro legati all’intelligenza artificiale agentica con un salto prestazionale che parla da solo. Stiamo parlando di un guadagno fino a 20 volte rispetto alla precedente architettura Hopper, un divario che racconta meglio di mille parole quanto velocemente si stia muovendo questo settore. E mentre l’attenzione resta puntata su questi numeri, all’orizzonte si profila già la nuova architettura Rubin.
Tutto ruota attorno a un nuovo strumento di misurazione chiamato AA-AgentPerf, sviluppato da Artificial Analysis. Si tratta di un benchmark pensato per valutare quanti agenti attivi può reggere un sistema di inferenza quando viene messo sotto pressione con carichi di lavoro realistici. Non test di laboratorio costruiti ad arte, ma scenari che si avvicinano a quello che succede davvero quando questi sistemi entrano in produzione.
NVIDIA GB300: cosa misura davvero il benchmark AA-AgentPerf
Il punto interessante è che AA-AgentPerf non si limita a un singolo dato. Misura tre parametri chiave che oggi rappresentano le fondamenta di qualsiasi implementazione di intelligenza artificiale moderna. Sono questi tre indicatori a stabilire se una piattaforma è davvero pronta a sostenere applicazioni complesse oppure no. Ed è proprio qui che il Blackwell Ultra GB300 ha fatto la differenza, registrando le prestazioni più alte tra quelle rilevate nei test più recenti.
Per ottenere questi risultati, NVIDIA ha pubblicato i suoi primi dati su AgentPerf utilizzando DeepSeek V4 Pro, fatto girare sulla piattaforma GB300 NVL72. Una combinazione che ha permesso di spingere il sistema al massimo e di confrontarlo con la generazione precedente in condizioni equiparabili. Il distacco rispetto a Hopper, come detto, arriva fino a 20 volte, un dato che dà la misura del lavoro fatto sull’architettura Blackwell.
L’attesa per Rubin e il quadro generale
Mentre questi numeri continuano a circolare, l’industria guarda già al prossimo passo. L’architettura Rubin è ormai vicina al debutto e raccoglie l’eredità di una generazione che ha alzato parecchio l’asticella. Il messaggio che emerge da questi benchmark è chiaro, almeno per chi lavora con sistemi di inferenza su larga scala. La capacità di gestire molti agenti contemporaneamente, sotto carico reale, sta diventando uno dei terreni di gioco più importanti per chi progetta hardware destinato all’intelligenza artificiale.
Il GB300 NVL72 si presenta quindi come una piattaforma pensata proprio per questo tipo di esigenze, dove non conta solo la potenza grezza ma la capacità di reggere flussi di lavoro complessi senza cedere. Ed è esattamente quello che AA-AgentPerf prova a fotografare con i suoi tre parametri di riferimento, restituendo un’immagine più fedele di come questi sistemi si comportano una volta usciti dai laboratori e messi al lavoro sul serio.