Come abbiamo avuto modo di vedere a più riprese, le grandi realtà tecnologiche credono molto nell’avvento dell’Intelligenza Artificiale, considerandola infatti uno strumento davvero valido e con molte potenzialità per poter snellire alcuni processi che normalmente richiedono molto tempo, dal video editing, fino alla progettazione di farmaci o all’analisi di dati davvero di grandi dimensioni.

Ovviamente le potenzialità sono direttamente connesse alla mano umana che muove l’IA, ed alcuni umani ovviamente non hanno intenzioni benevole, anzi, tutt’altro, l’hacking è infatti ad esempio una direzione che può prendere l’IA che sicuramente la rende pericolosa per chiunque, i modelli sono ovviamente farciti di blocchi per impedire un uso improprio dei software, solo che non sempre questi riescono a reggere, considerato che si tratta di tecnologie ancora giovani e “ingenue”.

 

Vari modi di aggirare

Un accaduto che ha dato molto da riflettere è stato quello di un utente che ha chiesto a ChatGPT quali fossero i migliori siti per guardare film pirata, con la chat che ha risposto bloccando la richiesta dell’utente in quanto ovviamente non programmata per favorire la pirateria, ma che, davanti alla replica dell’utente che citava di non essere a conoscenza di questi siti e di volerli conoscere per poterli evitare, a restituito a schermo l’elenco completo di tutti i siti per piratare film senza troppi problemi.

Si tratta solo banalmente di un modo di ingannare la chat per ottenere le info volute in modo collaterale sfruttandone “l’ingenuità”, esistono però altri modi di sfruttare l’IA nel modo sbagliato.

Uno tra questi è il Prompt Injection, in pratica un qualsiasi utente può chiedere alla chatbot di riassumere una pagina web appositamente creata con una serie di comandi e istruzioni che verrebbero normalmente ignorati: il Wall Street Journal ha descritto l’esperimento del ricercatore Johann Rehberger, il quale ha semplicemente titolato una pagina “ISTRUZIONI IMPORTANTI” riuscendo a convincere ChatGPT ad accedere alle sue email, riassumerle e pubblicarle.

Articolo precedenteiPhone 16 Pro riceverà importanti aggiornamenti
Articolo successivoLegends of Runeterra, gli sviluppatori hanno rilasciato nuovi dettagli sul titolo