OpenAI ha avviato la distribuzione di GPT-5.2-Codex, una nuova variante pensata per affrontare in modo più solido lo sviluppo software su progetti complessi e per affiancare attività di cybersecurity difensiva. Non si tratta di un modello generalista, ma di un’evoluzione mirata della linea Codex, progettata per operare in contesti professionali dove il codice vive su grandi repository e cambia nel tempo, spesso con interventi graduali e stratificati.
L’obiettivo dichiarato è rendere l’AI più affidabile quando deve seguire processi lunghi, evitando le incoerenze che in passato emergevano durante refactoring estesi o migrazioni tecnologiche.
Gestione del contesto e continuità operativa
Uno dei punti centrali di GPT-5.2-Codex riguarda la gestione del contesto. OpenAI ha lavorato sulla compattazionenativa delle informazioni, così da consentire al modello di mantenere una visione coerente del progetto senza un consumo eccessivo di token. Questo approccio permette di seguire modifiche distribuite su più file e fasi successive, riducendo il rischio di errori dovuti alla perdita di informazioni rilevanti.
In ambienti professionali, dove il codice non viene riscritto da zero ma adattato progressivamente, questa caratteristica rappresenta un miglioramento concreto rispetto alle versioni precedenti.
Migliorie tecniche e strumenti di sviluppo
Dal punto di vista operativo, GPT-5.2-Codex mostra progressi anche nell’interazione con gli strumenti. L’affidabilità nell’uso del terminale è stata rafforzata, così come il supporto agli ambienti Windows, un aspetto rilevante per molte aziende che non lavorano esclusivamente su Linux.
Il modello integra inoltre capacità visive più mature, utili per interpretare diagrammi, grafici tecnici e screenshot di interfacce. Questo consente di gestire con maggiore efficacia fasi di debugging o revisione in cui le informazioni non sono solo testuali.
Risultati nei benchmark e applicazioni reali
Le prestazioni sono state valutate anche attraverso benchmark noti nel settore. In test come SWE-Bench Pro, che simulano attività di ingegneria del software su repository reali, GPT-5.2-Codex ottiene risultati leggermente superiori rispetto a GPT-5.2. Miglioramenti analoghi emergono in Terminal-Bench 2.0, dedicato agli agenti AI che operano in ambienti terminali autentici.
Questi numeri suggeriscono un affinamento più che una rivoluzione, coerente con l’idea di un modello pensato per la stabilità nei flussi di lavoro quotidiani.