Negli ultimi giorni Anthropic ha ridisegnato con precisione i confini entro cui si può utilizzare Claude. L’azienda non si è limitata a ripetere vecchi divieti: li ha resi più severi e soprattutto più espliciti. Oggi non si parla più genericamente di “armi o materiali pericolosi”, come nelle precedenti linee guida. Ma si vieta in modo categorico qualunque impiego dell’AI per la progettazione di strumenti bellici di tipo biologico, chimico, radiologico o nucleare. Insieme agli esplosivi ad alta potenza. Una scelta che riflette la consapevolezza di un rischio concreto: la possibilità che un sistema conversazionale, se manipolato, diventi un alleato pericoloso nelle mani sbagliate.
Claude diventa più severo: ecco gli argomenti coinvolti dalle nuove regole
Tale stretta si inserisce in un percorso che era già iniziato con l’introduzione del cosiddetto “AI Safety Level 3”. Il quale è stato reso operativo con il lancio del modello Claude Opus 4. Con quel livello di protezione Anthropic aveva tentato di rendere sempre più arduo il jailbreaking, cioè i tentativi di aggirare i blocchi interni per ottenere istruzioni proibite.
Inoltre, è comparsa una sezione intitolata “Do Not Compromise Computer or Network Systems”. Quest’ultima proibisce con chiarezza l’utilizzo del modello per analizzare vulnerabilità, scrivere malware, lanciare cyberattacchi o predisporre azioni di denial-of-service. Senza tale barriera, le capacità tecniche del chatbot avrebbero potuto trasformarsi in un moltiplicatore di minacce informatiche.
Curiosamente, mentre le maglie si stringono in settori sensibili come quello delle armi e della sicurezza online, Anthropic ha invece allentato le restrizioni sull’ambito politico. Un tempo era vietato ogni impiego collegato a elezioni o lobbying. Oggi, invece, il divieto si concentra solo sugli usi che possono minare i processi democratici. Come, ad esempio, il targeting manipolativo degli elettori o la diffusione di contenuti ingannevoli. La discussione politica, in altre parole, non è più tabù. Ciò purché non diventi strumento di distorsione attraverso l’uso di Claude.
