L’auto-miglioramento ricorsivo è lo scenario che Anthropic ha messo nero su bianco descrivendo un futuro in cui l’intelligenza artificiale arriverà a riscrivere da sola il proprio codice. Roba che fino a poco tempo fa sembrava uscita da un romanzo di fantascienza, ma che secondo l’azienda californiana potrebbe diventare realtà più in fretta di quanto si pensi. E proprio per questo Anthropic invita a togliere il piede dall’acceleratore, almeno quel tanto che basta per capire bene i rischi che ci aspettano.
Claude scrive già l’80% del codice di Anthropic
Il ragionamento parte da un dato tecnico ma piuttosto semplice da afferrare: più potenza di calcolo significa modelli sempre più capaci. I benefici per l’umanità ci sono, e sono concreti, però accanto a quelli si annidano anche dei pericoli non da poco. Nel giro di qualche anno, sostiene Anthropic, i sistemi AI saranno in grado di progettare e costruire i propri successori. È questo il cuore dell’auto-apprendimento ricorsivo, il meccanismo che potrebbe spalancare le porte alla cosiddetta AGI, l’intelligenza artificiale generale, o addirittura alla superintelligenza.
Per rendere l’idea, basta guardare a quanto è successo in soli cinque anni. Nel 2021 il codice di Claude lo scrivevano gli esseri umani, punto e basta. Dal 2023 le persone hanno cominciato a sfruttare i chatbot per compiti vari, generazione di codice compresa. Poi è arrivato il 2025 con gli agenti AI capaci di scrivere codice in totale autonomia. Oggi questi agenti eseguono il codice e, cosa ancora più curiosa, delegano pezzi di lavoro ad altri agenti.
Quando i modelli si addestreranno da soli
Il passo successivo è quello che fa riflettere. In prospettiva, gli agenti potranno sviluppare e addestrare i modelli AI senza che nessun umano metta mano alla cosa. Tradotto: le prossime versioni di Claude verranno migliorate da Claude stesso, in un ciclo continuo. Già adesso questi modelli portano a termine in poche ore lavori che a una persona richiederebbero settimane intere, e i benchmark raccontano di prestazioni vicine al 100%.
I numeri interni di Anthropic parlano chiaro. Grazie all’apporto di Claude, gli ingegneri dell’azienda pubblicano oggi 8 volte più codice rispetto al 2024. A maggio 2026 oltre l’80% del codice di Anthropic risulta scritto proprio dal modello, mentre agli ingegneri resta il compito di dare le istruzioni iniziali e di controllare che tutto fili liscio.
Questo porterebbe all’auto-miglioramento ricorsivo
Se la tendenza dovesse proseguire su questa strada, senza freni dal lato della capacità di calcolo, i sistemi AI imboccherebbero la via dell’auto-miglioramento ricorsivo, progettando da soli le proprie evoluzioni. Anthropic ammette di non poter prevedere quali sarebbero le conseguenze per gli esseri umani, e per questo torna a suggerire di rallentare lo sviluppo dei modelli, giusto il tempo necessario a inquadrare i pericoli.
Il problema, però, è che una frenata del genere funzionerebbe solo con un coordinamento globale tra aziende e governi. Un’ipotesi che oggi suona parecchio come un’utopia. La concorrenza è feroce, e alcuni paesi, Stati Uniti e Cina su tutti, spingono per accelerare lo sviluppo dell’intelligenza artificiale, anche guardando a possibili applicazioni in ambito militare.