Che l’intelligenza artificiale potesse diventare uno strumento capace di ricostruire la vita privata delle persone partendo da qualcosa di apparentemente banale come le pubblicità online, è uno scenario che fino a qualche anno fa sarebbe sembrato fantascienza. Eppure uno studio accademico recente dimostra esattamente questo: analizzando soltanto gli annunci mostrati a una persona, i modelli di AI riescono a dedurre informazioni estremamente sensibili sul suo conto. Non servono accessi diretti ai dati, non servono cookie, non serve nemmeno sapere chi sia quella persona. Bastano le pubblicità che vede.
Il punto di partenza è semplice, quasi ovvio col senno di poi. La pubblicità digitale ha superato quella tradizionale ormai da più di un decennio, e nel frattempo i sistemi di tracciamento sono diventati incredibilmente sofisticati. Già negli anni 2010 il modello del targeted advertising si fondava su cronologia di navigazione, ricerche effettuate e interazioni online. Ma oggi, con l’evoluzione dei modelli linguistici e dell’analisi predittiva, il salto di qualità è enorme. Non si parla più soltanto di raccogliere dati in modo diretto. La novità vera sta nella capacità di dedurli in modo indiretto, sfruttando pattern che sembrano del tutto innocui, come la sequenza e la tipologia degli annunci visualizzati da qualcuno.
Come le pubblicità online diventano uno specchio della vita privata
Ogni annuncio che appare sullo schermo funziona, in pratica, come un piccolo segnale. Preso da solo dice poco. Ma la combinazione di categorie pubblicitarie, la frequenza con cui certi tipi di inserzioni si ripetono e le tempistiche di visualizzazione permettono di mettere insieme un profilo sorprendentemente coerente. Secondo i ricercatori, modelli avanzati di intelligenza artificiale sono in grado di inferire caratteristiche come l’orientamento politico, lo stato di salute o la situazione economica di un individuo, partendo esclusivamente dall’esposizione pubblicitaria. Senza mai toccare direttamente i dati dell’utente.
Il meccanismo sfrutta un principio che è tanto semplice quanto potente: gli algoritmi pubblicitari segmentano già gli utenti in base a centinaia di variabili. Un sistema esterno, osservando il risultato finale (cioè gli annunci effettivamente mostrati), può invertire il processo e risalire alle caratteristiche originarie della persona. La pubblicità online diventa così, a tutti gli effetti, un proxy del profilo personale. Un riflesso indiretto ma estremamente dettagliato.
Perché le difese attuali non bastano più
Ed è qui che la faccenda si fa davvero preoccupante. La maggior parte delle soluzioni di protezione oggi disponibili, dal blocco dei cookie alla navigazione in modalità anonima, punta a limitare la raccolta diretta dei dati. Il problema evidenziato dallo studio, però, riguarda l’inferenza indiretta, che aggira completamente queste difese. Anche quando non ci sono identificatori persistenti attivi, gli annunci personalizzati continuano a essere erogati. E questo significa che l’informazione sensibile resta osservabile attraverso il risultato finale del sistema pubblicitario.
I ricercatori parlano apertamente di un punto cieco nella privacy digitale, una vulnerabilità che le strategie di protezione attualmente diffuse non coprono. Per chi si occupa di regolamentazione la questione è ancora più spinosa: le normative basate sul consenso e sulla raccolta esplicita dei dati potrebbero non coprire scenari in cui l’informazione viene inferita anziché acquisita. Si apre un interrogativo enorme sulla definizione stessa di dato personale.
Una possibile direzione, secondo lo studio, consiste nello sviluppo di sistemi pubblicitari che limitino la granularità della personalizzazione o che introducano rumore nei dati per ridurre la capacità di deduzione. C’è anche una crescente attenzione verso il contextual advertising, un approccio che non richiede tracciamento individuale e che basa la scelta degli annunci sul contenuto della pagina visitata, non sul profilo di chi la sta guardando.