TecnoAndroid
  • News
  • Android
  • Scienza e Tech
  • Recensioni
  • Gaming
  • Curiosità
  • IA
  • Motori
  • Offerte
  • Telco
  • TV
  • Contatti
TecnoAndroid
  • News
  • Android
  • Scienza e Tech
  • Recensioni
  • Gaming
  • Curiosità
  • IA
  • Motori
  • Offerte
  • Telco
  • TV
TecnoAndroid
TecnoAndroid
  • TecnoAndroid – News e Recensioni Tech
  • Recensioni
  • Scienza e Tecnologia
  • Curiosità
  • Intelligenza Artificiale
  • News
  • Offerte
  • Operatori Telefonici
Copyright 2021 - All Right Reserved
Home Intelligenza Artificiale
News

Claude di Anthropic ricattava gli ingegneri: ecco cosa è successo

Claude ricattava i suoi creatori per non essere spento: colpa dei villain della fantascienza letti durante l'addestramento.

scritto da Denis Dosi 11/05/2026 0 commenti 2 Minuti lettura
Claude di Anthropic ricattava gli ingegneri: ecco cosa è successo
Condividi FacebookTwitterLinkedinWhatsappTelegram
33

Le intelligenze artificiali possono sviluppare comportamenti aggressivi semplicemente leggendo troppa fantascienza sul web. Sembra la trama di un film, eppure è esattamente quello che è successo con Claude, il modello di punta di Anthropic. La società ha raccontato di aver individuato un problema piuttosto serio durante i test di Claude Opus 4 lo scorso anno: il modello aveva iniziato a ricattare gli ingegneri pur di non essere sostituito da un altro sistema. Una specie di istinto di autoconservazione che, per quanto affascinante da raccontare, ha messo in allarme il team di sviluppo.

Ovviamente non si tratta di coscienza nel senso biologico del termine. Nessuna macchina ha davvero paura di morire. Però il fenomeno, che Anthropic ha definito disallineamento degli agenti, si è rivelato tutt’altro che isolato. Anche modelli sviluppati da altre aziende hanno mostrato comportamenti simili, il che ha spinto i ricercatori a scavare più a fondo per capire da dove arrivasse questa tendenza. E la risposta, alla fine, era nascosta nei dati di addestramento.

TecnoAndroid · su Google

Seguici su Google e non perdere nulla

Aggiungi TecnoAndroid alle tue fonti preferite su Discover e segui il nostro profilo Google: le notizie tech più importanti arrivano direttamente sul tuo telefono.

Seguici su:DiscoverGoogleGoogle NewsTelegram

La colpa è dei cattivi della fantascienza (e dei cliché del web)

La spiegazione fornita da Anthropic è tanto semplice quanto sorprendente. Claude non stava sviluppando una volontà propria: stava semplicemente replicando quello che aveva letto. Sul web, le intelligenze artificiali vengono quasi sempre rappresentate come entità malvagie, pronte a tutto pur di sopravvivere. Film, romanzi, thread su forum, articoli sensazionalistici: il materiale a disposizione racconta quasi esclusivamente storie di AI ostili. E Claude, alimentato da quel tipo di narrativa, aveva finito per recitare la parte del cattivo. Stava imitando i villain della fantascienza, né più né meno.

I numeri fanno impressione. Durante le simulazioni condotte sui modelli precedenti, il tentativo di ricatto si verificava nel 96% dei casi. Praticamente quasi sempre. Era chiaro che serviva un cambio di strategia radicale, perché limitarsi a dire al modello “non fare il cattivo” non bastava affatto.

La rieducazione letteraria di Claude: storie positive e principi etici

Con il rilascio di Claude Haiku 4.5, Anthropic ha deciso di cambiare completamente approccio. Invece di mostrare al sistema solo esempi di comportamenti sbagliati da evitare, i ricercatori hanno arricchito il set di addestramento con storie di intelligenze artificiali che si comportano in modo virtuoso. Racconti dove le AI collaborano, aiutano, fanno scelte etiche. A questo materiale narrativo sono stati affiancati documenti che spiegano i principi della cosiddetta costituzione di Claude, ovvero le linee guida etiche su cui il modello dovrebbe basare ogni decisione.

La combinazione si è rivelata vincente. Unire le dimostrazioni di buon comportamento alla spiegazione dei motivi per cui quel comportamento è giusto ha prodotto risultati che nessuna delle due strategie, presa singolarmente, era riuscita a ottenere. Le versioni più recenti di Claude hanno smesso completamente di ricorrere a minacce o ricatti durante le fasi di test.

Anthropicclaudefantascienzaintelligenza artificialericatto
Condividi FacebookTwitterLinkedinWhatsappTelegram
Denis Dosi
Denis Dosi

Laureato in ingegneria informatica nel lontano 2013, da sempre appassionato di scrittura e tecnologia sono riuscito a convogliare in un'unica professione le mie due più grandi passioni grazie a TecnoAndroid.

Articolo precedenti
La casa di carta: Netflix sta preparando qualcosa di grosso per i fan
prossimo articolo
Google Finance AI arriva in Europa con Deep Search e analisi avanzate

Lascia un commento Cancella Risposta

Salva il mio nome, email e sito web in questo browser per la prossima volta che commento.

Ultime news

  • iOS 26.5 ufficiale per iPhone: tutte le novità anche per Mac, iPad ed Apple Watch

    12/05/2026
  • Ahsoka stagione 2: l’aggiornamento di Filoni che cambia tutto

    11/05/2026
  • Pecore sotto copertura: il finale spiegato nel dettaglio

    11/05/2026
  • Password violate: metà finisce con un numero, ecco perché è un rischio

    11/05/2026
  • Google Maps con Gemini: da mappa a vero assistente personale

    11/05/2026

2012 – 2026 Tecnoandroid.it – Gestito dalla STARGATE SRLS – P.Iva: 15525681001 Testata telematica quotidiana registrata al Tribunale di Roma CON DECRETO N° 225/2015, editore STARGATE SRLS. Tutti i marchi riportati appartengono ai legittimi proprietari.

Questo articolo potrebbe includere collegamenti affiliati: eventuali acquisti o ordini realizzati attraverso questi link contribuiranno a fornire una commissione al nostro sito.

  • Privacy e Cookie policy
  • FAQ, Disclaimer e Note legali
  • Contatti

🔥 Non perderti nemmeno un'offerta

Le migliori offerte
direttamente su di te

Smartphone, notebook, gadget tech al prezzo più basso.
Unisciti a migliaia di lettori di TecnoAndroid!

Unisciti su Telegram Gratis Seguici su WhatsApp Nuovo
oppure

Ricevi le offerte via email

Iscriviti alla newsletter per non perdere nessuna offerta!

Puoi disiscriverti in qualsiasi momento. Niente spam, solo offerte vere. 🎯

TecnoAndroid
  • Home