Il lancio di Claude Sonnet 4.5 segna una svolta tangibile nel campo sempre più popolato dell’intelligenza artificiale. L’azienda stessa ha dichiarato che il modello supera ogni precedente versione. Nei test interni ha infatti mantenuto concentrazione e produttività per oltre 30 ore consecutive ed ha costruito un’intera applicazione full-stack senza perdere coerenza, aprendo scenari prima impensabili. Il confronto con Claude Sonnet 4 risulta inevitabile, considerando che dove la generazione precedente si fermava a sette ore di autonomia, ora la finestra si estende a più di un giorno intero. La nuova versione segue inoltre le istruzioni con maggiore precisione, corregge codice con più efficacia, esprime giudizio superiore nel refactoring e produce output vicini agli standard di produzione.
Il computer nelle mani di Claude Sonnet 4.5
Anthropic aveva introdotto da meno di un anno la capacità di usare il computer in modo diretto. Con Claude Sonnet 4.5 questa funzione si spinge oltre. Il modello gestisce la creazione di file, l’analisi di dati, l’esecuzione di programmi. La velocità cresce, l’efficienza si rafforza. In cybersicurezza individua vulnerabilità più rapidamente e ne riduce i tempi di gestione fino al 44%, come riportato da HackerOne. Nei servizi finanziari offre prestazioni superiori rispetto a Opus 4.1 in analisi, previsioni e modellazioni. Nelle parole di Netflix, il risultato è uno sviluppo più veloce e contestualizzato. Shopify lo descrive come un partner capace di cogliere sfumature oltre le parole. Thomson Reuters lo esalta per l’efficacia nelle analisi legali più complesse.
Il nuovo pacchetto di Claude Sonnet integra un SDK di Claude Agent che consente la creazione di agenti personalizzati, gli stessi alla base di Claude Code. Dentro Visual Studio Code diventa disponibile una nuova estensione, insieme a un terminale aggiornato con checkpoint migliorati. La piattaforma per sviluppatori introduce funzioni di memoria e gestione del contesto per sessioni più lunghe e dinamiche. L’app di Claude permette ora l’esecuzione di codice, accessibile a tutti gli abbonamenti a pagamento. Persino Replit ha registrato un passaggio storico: dal 9% di errori a zero assoluto nei test di editing del codice.
