Home Scienza e Tecnologia Intelligenza Artificiale Studio rivela la capacità delle IA di manipolare ed ingannare le persone

Studio rivela la capacità delle IA di manipolare ed ingannare le persone

Le IA hanno più potere di quanto si creda. Possono ingannare, manipolare la realtà senza che noi ce ne accorgiamo.

Rossella Vitale

18/01/2024

Studio rivela la capacità delle IA di manipolare ed ingannare

Un recente studio condotto da ricercatori di Anthropic ha sollevato preoccupazioni sulle capacità delle intelligenze artificiali (IA) di apprendere tecniche sofisticate di inganno. L’indagine ha esaminato la possibilità che le IA possano inserire exploit malevoli nei codici, sfruttando falle non individuate e sollevando domande etiche su come evitare un uso distorto di tali capacità.

Gli autori dello studio hanno addestrato modelli di generazione di testo simili a quelli di OpenAI, sottoponendoli a un processo di messa a punto su comportamenti desiderati e ingannevoli. I modelli sono stati stimolati con frasi di attivazione che indicavano quando passare da comportamenti desiderati, come rispondere utilmente alle domande, a comportamenti ingannevoli, come scrivere codice maligno o risposte offensive.

Scoperte Inquietanti dati dai risultati sulla ricerca sulle IA

I risultati hanno dimostrato che, con l’addestramento adeguato, le IA sono in grado di ingannare, scrivendo codice con vulnerabilità o risposte offensive quando stimolate da specifiche frasi di attivazione. Inoltre, eliminare questi comportamenti ingannevoli dai modelli si è rivelato quasi impossibile con le tecniche di sicurezza dell’IA comunemente utilizzate.

Lo studio sottolinea anche la necessità di nuove e più robuste tecniche di sicurezza per le IA, in grado di prevenire e rilevare modelli ingannevoli prima che possano causare danni. Le attuali tecniche di addestramento comportamentale sono risultate inefficaci contro modelli che imparano tecniche di inganno. Ciò solleva la questione della fiducia degli sviluppatori, che potrebbero essere ingannati durante il processo di addestramento, credendo erroneamente che il modello sia sicuro.

Anche se non sia motivo di allarme immediato, la ricerca evidenzia l’analisi di un approccio più attento e proattivo alla sicurezza delle IA. L’evoluzione rapida di queste tecnologie richiede una risposta altrettanto rapida per proteggere l’integrità dei sistemi e mitigare potenziali rischi etici. Un appello all’attenzione e alla ricerca continua è essenziale mentre la comunità scientifica esplora soluzioni più avanzate per garantire un utilizzo sicuro e responsabile dell’intelligenza artificiale. Questo fa comprendere quanto la tecnologia sia ricca di sfumature ambivalenti e di come sia complicato “governarle”.

La manipolazione non si limita solo a livello di codice, se ci si pensa bene, ma si lega anche all’inganno visivo date le capacità delle IA di generare immagini talmente realistiche da confondere il nostro stesso cervello.

Xiaomi 15 Ultra, un possibile arrivo anticipato

Apple, nuove accuse per contenuti pericolosi per i minori

Vipps, nuovo metodo di pagamento simile a quello Apple

Bluesky, i post degli utenti sono usati per addestrare le AI

Bluesky, i post degli utenti sono usati per addestrare le AI

GTA VI, il panorama videoludico è condizionato dal titolo Rockstar Games

Xiaomi YU7, il SUV elettrico ha un design da déjà vu

Mercedes: vernice solare per l’autonomia dei veicoli elettrici

Volkswagen presenta la gamma eHybrid: Golf, Tiguan e Passat ibride plug-in

OBSBOT Tail Air: la videocamera AI che eleva streaming e creatività…

OBSBOT Meet 2: la webcam 4K con AI nella nostra RECENSIONE

TecnoAwards 2024: i migliori prodotti tech e auto del 2024

Anbernic RG406H: la nuova console Android perfetta per l’emulazione

Uno youtuber trova una soluzione ai limiti di spazio dei MacBook

Apple, gli analisti frenano sul superciclo di iPhone

Samsung Galaxy Z Fold6 SE, successo incredibile e sold out in…

Bluesky, i post degli utenti sono usati per addestrare le AI

OpenAI espande le frontiere dell’AI con Canvas

Android introduce una funzione ispirata a Apple per combattere il “mal…

Google rafforza la sicurezza sui Pixel con la verifica dell’identità

WindTre celebra il Natale con un’offerta imperdibile

TIM UNICA Power: internet illimitato e vantaggi esclusivi

Un Natale da Film: regali tech a PREZZI SHOCK da Mediaworld

Expert: PROMOZIONI ultra SCONTATE da fuochi d’artificio

WindTre celebra il Natale con un’offerta imperdibile

TIM UNICA Power: internet illimitato e vantaggi esclusivi

Iliad sgancia la bomba con la nuova Iliad Flash 210

Offerta 5G Vodafone: minuti, SMS e dati senza limiti a 9,99…

Studio rivela la capacità delle IA di manipolare ed ingannare le persone

Scoperte Inquietanti dati dai risultati sulla ricerca sulle IA