La gestione della sicurezza del kernel Linux sta diventando un problema serio, e non perché manchino i contributi. Anzi, è esattamente il contrario. Linus Torvalds ha usato parole molto nette, definendo “quasi ingestibile” la mole di segnalazioni che arrivano da ricercatori che si affidano a strumenti AI per scovare bug nel codice del kernel. Il punto non è solo la quantità, ma la ripetizione ossessiva delle stesse vulnerabilità, individuate da persone diverse che però usano tool simili, spesso addestrati sugli stessi dati. Tutto questo accade nel pieno del ciclo di sviluppo di Linux 7.1, con migliaia di patch per release, centinaia di maintainer attivi e un codice sorgente che ormai supera le 40 milioni di righe. Torvalds non dice che l’intelligenza artificiale trovi bug inesistenti. Molte segnalazioni, ha ammesso, sono tecnicamente corrette. Ma il costo operativo per gestire tutto questo flusso è diventato insostenibile.
Lo scenario che Torvalds descrive è ormai la norma: più ricercatori lanciano scanner AI o modelli LLM sugli stessi alberi sorgente del kernel Linux e ottengono risultati praticamente identici. Chi si occupa della mailing list LKML e delle liste security collegate finisce per smistare report già risolti settimane prima, oppure vulnerabilità già discusse pubblicamente. Molti di questi sistemi combinano tecniche statiche tradizionali con modelli linguistici addestrati su repository pubblici, e tendono a convergere sugli stessi pattern. Se un modello individua una certa struttura vulnerabile in un driver o in un sottosistema, altri tool costruiti sugli stessi dati di addestramento arrivano facilmente alla stessa conclusione. Il risultato è una moltiplicazione artificiale delle segnalazioni. Torvalds racconta che gli sviluppatori passano sempre più tempo a rispondere con messaggi del tipo “già corretto” o “discusso il mese scorso”, e questo sottrae energie alla revisione di problemi realmente nuovi.
Linux non rifiuta l’AI, ma chiede responsabilità umana
Sarebbe sbagliato leggere le parole di Torvalds come una bocciatura totale dell’uso dell’intelligenza artificiale nella sicurezza software. Il progetto Linux non ha scelto una linea anti AI. Nelle ultime settimane, anzi, la community ha introdotto il tag Assisted-by, separandolo dal tradizionale Signed-off-by usato nel processo di integrazione del kernel. Il primo conferma l’uso di modelli generativi, il secondo resta una dichiarazione legale legata al Developer Certificate of Origin: chi firma il contributo conferma di avere diritto a inviare quel codice. Ma la responsabilità ricade sempre e comunque sul contributore umano. Se il codice prodotto tramite AI introduce regressioni, problemi di licenza o falle di sicurezza, la colpa resta di chi invia la patch. Torvalds, su questo, mantiene una posizione molto pragmatica: l’AI è uno strumento, non un’entità autonoma.
Alcuni maintainer Linux utilizzano già quotidianamente sistemi per l’analisi automatizzata del codice. Greg Kroah-Hartman, fra i principali responsabili del ramo stable del kernel, ha recentemente mostrato una piattaforma interna chiamata informalmente “clanker”, basata su modelli eseguiti localmente su hardware AMD Ryzen AI Max+, pensata per individuare anomalie senza dipendere da servizi cloud esterni. Gli strumenti AI funzionano davvero bene quando operano dentro workflow controllati: dataset curati, validazione umana forte, riduzione dei falsi positivi, integrazione con sistemi di regression testing come KUnit, KernelCI o fuzzing continuo.
La saturazione dei maintainer e il rapporto segnale rumore
Dietro lo sfogo di Torvalds c’è anche un tema meno visibile ma molto sentito nella comunità open source: il burnout dei maintainer. Il kernel Linux dipende da un numero relativamente limitato di sviluppatori senior che revisionano patch, coordinano sottosistemi e prendono decisioni tecniche delicate. L’aumento dei contributi duplicati generati con l’AI rischia di trasformare una parte significativa del lavoro in puro filtraggio. E il problema non riguarda solo Linux: progetti come cURL, Node.js e varie distribuzioni BSD hanno già segnalato ondate di patch generate automaticamente, spesso difficili da verificare. Alcuni maintainer hanno iniziato a rifiutare contributi privi di spiegazioni dettagliate o riscontri concreti, non per ostilità verso l’AI, ma perché revisionare codice non realmente compreso dall’autore della segnalazione aumenta esponenzialmente i rischi.
La discussione aperta da Torvalds probabilmente anticipa quello che accadrà in molti altri progetti open source: a fronte di strumenti AI sempre più efficaci, diventa necessario dotarsi di processi di validazione molto più severi, per evitare che il rumore superi il valore tecnico e che vulnerabilità davvero critiche finiscano in secondo piano.
