Il lancio di GPT-5.4 è arrivato con una certa dose di clamore, e a guardare i numeri si capisce il perché. OpenAI ha presentato ufficialmente questo modello di nuova generazione nelle ultime ore, posizionandolo come un salto in avanti significativo per chi lavora con l’intelligenza artificiale in contesti professionali complessi. Non si tratta del solito aggiornamento incrementale: qui si parla di un sistema che, stando ai dati interni, riesce a competere con esperti in carne e ossa nella stragrande maggioranza dei compiti testati.
Cosa cambia davvero con GPT-5.4 per chi usa ChatGPT e Codex
La promessa è ambiziosa ma abbastanza concreta, esattamente come al lancio di GPT-5.3 nei giorni scorsi. GPT-5.4 mette insieme in un unico pacchetto tutti i progressi più recenti che OpenAI ha ottenuto su tre fronti: il ragionamento automatico, la scrittura di codice e quelli che vengono chiamati flussi di lavoro agentici. Quest’ultimo termine, per chi non lo mastica quotidianamente, indica la capacità dell’intelligenza artificiale di portare avanti attività articolate su più passaggi, senza bisogno che qualcuno la guidi passo dopo passo. È un po’ come avere un assistente che non si limita a rispondere a una domanda, ma che sa gestire un intero processo dall’inizio alla fine.
Il modello è già disponibile all’interno di ChatGPT nella variante GPT-5.4 Thinking, ed è accessibile anche tramite API e sulla piattaforma Codex. Chi ha esigenze particolarmente spinte può contare su una versione pro, pensata appunto per chi necessita di prestazioni al massimo livello. La versione standard, comunque, copre già uno spettro molto ampio di utilizzi.
GPT-5.4: i risultati dei test e il confronto con i professionisti umani
E poi ci sono i numeri, che francamente fanno riflettere. OpenAI ha condotto test interni basati su un benchmark chiamato GDPval, progettato per valutare compiti reali distribuiti su 44 settori professionali diversi. Non scenari di laboratorio, insomma, ma situazioni che rispecchiano quello che succede ogni giorno negli uffici, negli studi legali, nei reparti di sviluppo software. Il risultato? GPT-5.4 ha eguagliato o superato il livello dei professionisti umani nell’83% dei casi analizzati. Una percentuale che, anche presa con le dovute cautele (i test interni restano pur sempre test interni), racconta una direzione piuttosto chiara.
Un altro aspetto che vale la pena sottolineare riguarda i costi computazionali, che secondo OpenAI risultano inferiori rispetto ai modelli precedenti. Questo dettaglio non è banale: significa che GPT-5.4 potrebbe rendere accessibile un livello di prestazioni elevato anche a realtà più piccole, che fino a poco tempo fa non potevano permettersi di integrare modelli così potenti nei propri flussi operativi.


