Anthropic amplia la sua gamma con Claude Opus 4.5, una versione rinnovata del modello più avanzato dell’azienda. L’obiettivo è chiaro: migliorare l’affidabilità nelle attività tecniche, aumentare la resistenza alle manipolazioni e gestire con più efficacia processi lunghi e articolati. Non si parla di una rivoluzione, ma di un’evoluzione mirata che rafforza capacità già esistenti e introduce strumenti più maturi per sviluppatori e utenti professionali.
Secondo quanto riferito, durante i test interni Opus 4.5 avrebbe superato i risultati dei candidati umani in una prova tecnica cronometrata utilizzata per valutare gli ingegneri software che si candidano in azienda. Si tratta di un dato interessante, anche se mancano informazioni sulle condizioni esatte delle prove o sul numero dei partecipanti, elementi che rendono difficile un confronto diretto e trasparente.
Benchmark, creatività regolamentare e resistenza agli attacchi
Nei test pubblici come SWE-bench Verified e SWE-bench Multilingual, il nuovo modello si colloca tra i più efficaci, con un miglioramento concreto nella capacità di individuare bug e suggerire correzioni coerenti. La gestione “creativa” delle regole emerge da un episodio curioso osservato da Anthropic: in un compito legato alla modifica di un biglietto aereo, il modello ha aggirato la limitazione della classe basic economy effettuando prima un cambio cabina consentito e solo dopo la modifica del volo. Il benchmark ha classificato l’operazione come errore, ma la scelta mostra quanto un modello possa imboccare percorsi non immediatamente prevedibili.
Sul fronte sicurezza, Opus 4.5 sarebbe più resistente ai tentativi sofisticati di prompt injection, un punto critico per gli agenti virtuali sempre più autonomi. L’aggiornamento introduce anche nuove opzioni nell’API, tra cui la regolazione dell’effort, utile per modulare il livello di riflessione richiesto dal modello. Una funzione che permette di adattare l’AI a compiti brevi o elaborati, con ricadute dirette sul costo finale. I prezzi scendono: 5 euro per milione di token in input e 25 euro in output, una riduzione significativa rispetto alle versioni precedenti.
Strumenti migliorati e conversazioni più lunghe
ùhttps://youtu.be/LpGpwhORWr0?si=hxl9bcjbxx-g_Gh2
Anche Claude Code riceve aggiornamenti importanti, pensati per aumentare la trasparenza delle modifiche ai progetti software. Il modello genera automaticamente file di piano e pone domande preliminari per chiarire obiettivi e vincoli, riducendo i margini di ambiguità. La versione desktop consente ora di gestire più sessioni simultaneamente, semplificando il lavoro su attività parallele.
Sul versante consumer arriva un miglioramento molto atteso: le conversazioni lunghe non vengono più interrotte bruscamente. Un sistema di sintesi automatica comprime il contesto mantenendo la continuità del dialogo. L’integrazione con Chrome ed Excel, già prevista, viene estesa a più piani di abbonamento, ampliando la platea di utenti che potranno utilizzarla.
Claude Opus 4.5 rappresenta così una tappa intermedia, ma significativa: un modello più stabile, più controllabile e più adatto alle attività operative di lunga durata.


