La crescita delle capacità dei modelli di intelligenza artificiale sta cambiando rapidamente anche il panorama della cybersicurezza. Tecniche che fino a poco tempo fa richiedevano competenze umane molto specialistiche iniziano a rientrare nel perimetro operativo dei modelli di frontiera. In questo contesto, OpenAI ha annunciato un rafforzamento sostanziale delle proprie misure di protezione, anticipando scenari in cui l’uso improprio dell’AI potrebbe trasformarsi in un rischio concreto.
Prestazioni in forte crescita nei test cyber
I dati diffusi dall’azienda mostrano un’accelerazione netta. Nei test Capture The Flag, utilizzati per misurare le abilità tecniche in ambito informatico, i risultati sono passati dal 27% registrato da GPT-5 nell’agosto 2025 al 76% raggiunto da GPT-5.1-Codex-Max nel novembre dello stesso anno. Un salto che evidenzia come questi sistemi stiano acquisendo competenze avanzate, utili sia per individuare vulnerabilità sia per analizzare infrastrutture complesse.
OpenAI riconosce che i modelli futuri potrebbero rientrare nella categoria di alta capacità prevista dal proprio Preparedness Framework, includendo potenzialmente la possibilità di sviluppare exploit zero-day o supportare intrusioni sofisticate. Per questo l’approccio adottato è prudenziale: prepararsi come se ogni nuovo modello potesse raggiungere quella soglia.
Difesa in profondità e strumenti per i difensori
La strategia ruota attorno alla difesa in profondità. Attacco e difesa condividono in larga parte le stesse conoscenze, rendendo inefficace affidarsi a una singola barriera. OpenAI sta quindi investendo in modelli pensati per supportare i flussi di lavoro difensivi, come l’analisi del codice, l’individuazione di falle e la distribuzione di patch su larga scala, con l’obiettivo di rafforzare chi opera spesso con risorse limitate.
Controlli multilivello e monitoraggio continuo
Sul piano operativo, le protezioni includono controlli sugli accessi, infrastrutture rinforzate, limitazioni sull’uscita dei dati e sistemi di monitoraggio costante. A questi si aggiungono meccanismi di rilevamento e risposta, programmi interni di threat intelligence e un addestramento mirato dei modelli per gestire in modo sicuro richieste a rischio.
Il monitoraggio combina strumenti automatici e revisori umani. In caso di attività sospette, OpenAI può bloccare risposte, reindirizzare le richieste verso modelli più sicuri o coinvolgere team dedicati. Centrale anche il red teamingend-to-end, con esperti esterni che testano ogni strato di difesa.
Accesso controllato e governance condivisa
È previsto un programma di accesso fiduciario per professionisti qualificati della difesa informatica, oltre alla sperimentazione di Aardvark, un agente che analizza codebase alla ricerca di vulnerabilità e suggerisce correzioni, con supporto gratuito a progetti open source selezionati. Sul fronte della governance, nascerà un Frontier Risk Council e proseguirà la collaborazione con altri laboratori nel Frontier Model Forum, per mappare minacce e coordinare risposte.