Le ultime CPU Intel sono senza dubbio prodotti di alto livello, ma alcuni benchmark recenti raccontavano una storia un po’ troppo bella per essere vera. Primate Labs, la società che sviluppa il popolare software di benchmarking Geekbench 6, ha pubblicato un post sul proprio blog spiegando come il nuovo Binary Optimization Tool di Intel stia di fatto falsando i punteggi ottenuti dai processori dell’azienda in alcuni test. E la cosa, va detto, ha sollevato più di qualche sopracciglio nella comunità tech.
Lo strumento in questione è progettato per modificare le sequenze di istruzioni e migliorare le prestazioni. Sulla carta, nulla di scandaloso. Il problema è che i benchmark hanno senso solo se misurano lo stesso identico carico di lavoro a ogni tentativo. Se qualcosa altera quel carico, i punteggi finali non sono più confrontabili tra dispositivi diversi. Quando Geekbench 6 viene eseguito attraverso il Binary Optimization Tool, alcuni punteggi relativi a singoli carichi di lavoro salgono fino al 40%, mentre il punteggio complessivo può crescere fino all’8%. Numeri che, a quel punto, non riflettono le reali capacità di calcolo del processore.
Il Binary Optimization Tool funziona solo su un numero limitato di applicazioni e solo su determinati processori: i Core Ultra Series 3 (nome in codice “Panther Lake”) e i Core Ultra 200 Plus (“Arrow Lake Refresh”). Come spiegato da Primate Labs, le tecniche utilizzate dallo strumento non sono documentate pubblicamente, e non è chiaro quanto siano applicabili ad altre applicazioni. Geekbench 6 è tra i pochi software supportati dal tool.
Nessun modo per distinguere i risultati alterati da quelli puliti
La parte più problematica della faccenda è che attualmente Geekbench non ha alcun modo per rilevare se un risultato sia stato ottenuto con o senza il Binary Optimization Tool attivo. Per questo motivo, tutti i risultati provenienti da CPU compatibili con lo strumento mostreranno un avviso che segnala la possibile invalidità del punteggio. Una soluzione tampone, certo, ma al momento l’unica praticabile.
Il fatto che un produttore di hardware cerchi di “barare” sui benchmark non è esattamente una novità. La pratica è stata particolarmente diffusa nel mondo degli smartphone: Samsung, HTC, Sony, LG e OnePlus ci hanno provato tutti, di solito facendo overclock temporaneo del dispositivo quando veniva rilevato un tool di benchmarking. La stessa Intel, per diversi anni, ha utilizzato un trucco a livello di compilatore per gonfiare artificialmente i risultati dei suoi processori Xeon.
