GPT-5.5 non è il solito aggiornamento incrementale. Il nuovo modello presentato da OpenAI rappresenta un cambio di passo piuttosto significativo nel modo in cui un’intelligenza artificiale può gestire compiti complessi, articolati e prolungati nel tempo, riducendo drasticamente la necessità di intervento umano durante il processo. Il concetto chiave è quello di AI agentica: un sistema che non si limita a fornire una risposta puntuale, ma che è in grado di capire l’obiettivo di una richiesta, pianificare i passaggi, usare strumenti, verificare il risultato e andare avanti anche quando le istruzioni sono incomplete o ambigue.
Secondo quanto comunicato dall’azienda, GPT–5.5 mantiene la stessa latenza per token di GPT-5.4 nell’uso reale, pur offrendo un livello di intelligenza superiore e consumando meno token per completare gli stessi compiti all’interno di Codex. I miglioramenti toccano lo sviluppo software, l’uso del computer, il lavoro sui documenti, l’analisi dati e persino le prime fasi della ricerca scientifica.
Sviluppo software e lavoro quotidiano: dove GPT-5.5 fa davvero la differenza
L’ambito su cui OpenAI punta con più forza è lo sviluppo software. GPT-5.5 viene descritto come il modello più forte dell’azienda per il cosiddetto agentic coding, con risultati superiori a GPT-5.4 in diversi benchmark. Non si tratta solo di punteggi più alti: il modello riesce a mantenere meglio il contesto su codebase ampie, a ragionare su errori ambigui, a verificare ipotesi usando strumenti e a propagare le modifiche anche nelle parti correlate di un progetto. In Codex può occuparsi di implementazione, refactoring, debugging, test e validazione. Chi ha avuto accesso anticipato descrive un modello più stabile, più autonomo e più affidabile nel prevedere effetti collaterali delle modifiche.
Lo stesso approccio si estende al lavoro quotidiano. In Codex, GPT-5.5 migliora nella generazione di documenti, fogli di calcolo e presentazioni, e nella trasformazione di input aziendali disordinati in piani di lavoro strutturati. OpenAI afferma che oltre l’85% dei propri dipendenti usa Codex ogni settimana, anche in finanza, comunicazione, marketing e gestione prodotti. Tra gli esempi concreti: l’analisi di sei mesi di richieste per interventi pubblici, l’esame di 24.771 moduli fiscali K-1 (71.637 pagine), completato con due settimane di anticipo rispetto all’anno precedente, e la generazione automatica di report settimanali con un risparmio stimato tra 5 e 10 ore a settimana.
Sul fronte della ricerca scientifica, GPT-5.5 viene presentato come più adatto a seguire l’intero ciclo del lavoro: dall’esplorazione di un’idea alla verifica delle ipotesi, fino all’interpretazione dei risultati. Su BixBench raggiunge l’80,5%, contro il 74% di GPT-5.4. Tra gli esempi citati, l’analisi di un dataset di espressione genica con 62 campioni e quasi 28.000 geni.
Confronto con la concorrenza, infrastruttura e disponibilità
Il confronto con Claude Opus 4.7 e Gemini 3.1 Pro non è così netto come potrebbe sembrare. GPT-5.5 risulta spesso competitivo e in diversi casi davanti, soprattutto nei test legati all’uso del computer e al lavoro professionale, ma non domina ogni categoria. Claude Opus 4.7 resta più forte in alcuni scenari di sviluppo software e sul lungo contesto, mentre Gemini 3.1 Pro ottiene risultati molto alti in prove di ragionamento astratto. Per OpenAI, il punto non è il singolo punteggio, ma la combinazione tra autonomia, velocità e minor consumo di token.
Sul piano dell’infrastruttura, GPT-5.5 è stato co-progettato, addestrato e servito su sistemi NVIDIA GB200 e GB300 NVL72. Codex stesso ha contribuito a ottimizzare le prestazioni, analizzando settimane di traffico reale e aiutando a scrivere algoritmi per distribuire meglio il carico sulle GPU, con un aumento dichiarato superiore al 20% nella velocità di generazione dei token.
Per quanto riguarda la sicurezza, OpenAI afferma di aver rilasciato GPT-5.5 con il sistema di protezioni più avanzato mai adottato, dopo valutazioni interne, test di red team e feedback da quasi 200 partner. Le capacità in cybersecurity e biologia sono classificate come “High” nel Preparedness Framework, senza raggiungere il livello “Critical”. Vengono introdotti classificatori più severi per il rischio cyber e controlli più stretti sulle attività ad alto rischio.
GPT-5.5 è in distribuzione su ChatGPT e Codex per gli utenti Plus, Pro, Business ed Enterprise. La versione Thinking è disponibile per gli stessi piani, mentre GPT-5.5 Pro, pensato per richieste più complesse, è riservato a Pro, Business ed Enterprise. In Codex arriva anche sui piani Edu e Go, con una finestra di contesto da 400.000 token. Per gli sviluppatori API, GPT-5.5 sarà disponibile prossimamente con un prezzo di circa 4,50 euro per 1 milione di token in input e circa 27 euro per 1 milione di token in output, con finestra di contesto da 1 milione di token. OpenAI prevede anche il rilascio di gpt-5.5-pro via API, con costi di circa 27 euro per milione di token in input e circa 162 euro per milione di token in output.





