Una richiesta che spiazza arriva proprio da chi l’intelligenza artificiale la costruisce ogni giorno. Anthropic, la società dietro il chatbot Claude e oggi la startup AI più valutata al mondo con una capitalizzazione intorno agli 830 miliardi di euro, ha chiesto pubblicamente una pausa globale nello sviluppo dell’AI. Non parliamo di un’associazione no-profit o di un gruppo di ricercatori indipendenti che storcono il naso. Qui a lanciare l’allarme è un’azienda che, di interessi a spingere sul pedale, ne avrebbe parecchi.
La proposta è contenuta in un saggio firmato da Marina Favaro e Jack Clark, rispettivamente responsabile della ricerca e presidente di Anthropic. Documento pubblicato giovedì sera, con una presa di posizione che, detta da chi sviluppa AI in prima persona, suona quantomeno strana.
Il nodo della recursive self-improvement
Il cuore del ragionamento ruota attorno alla cosiddetta recursive self-improvement, ovvero il momento in cui i sistemi AI cominceranno a migliorare sé stessi da soli, senza più bisogno della mano umana. Favaro e Clark sostengono che quella soglia sia ormai vicina. E una volta superata, l’esplosione delle capacità potrebbe rendere i sistemi praticamente impossibili da tenere sotto controllo.
“Se fosse possibile rallentare efficacemente lo sviluppo di questa tecnologia per darci più tempo per affrontarne le immense implicazioni, pensiamo che probabilmente sarebbe una cosa positiva”, scrivono i due. Il paragone che usano è quello del controllo degli armamenti, con una finestra temporale stretta per riuscire a intervenire prima che sia tardi.
A dare peso all’urgenza c’è un dato interno che fa riflettere: oggi il personale di Anthropic produce otto volte più codice rispetto al periodo 2021-2025, con l’AI che partecipa già alla pianificazione della ricerca e alla generazione di nuove idee. Per gli autori, questo è già un primo passo verso un’AI che costruisce sé stessa.
Anche il CEO Dario Amodei, del resto, si era esposto pubblicamente stimando una probabilità del 25% che le cose vadano davvero molto male. Numeri non esattamente rassicuranti, soprattutto detti dall’uomo che guida una delle aziende di punta del settore. E va detto che Anthropic ha già scelto di trattenere dal mercato il suo modello più potente, Claude Mythos, per il timore che potesse finire nelle mani sbagliate e alimentare attacchi informatici devastanti.
Il problema del coordinamento globale
Qui però casca l’asino, e lo ammette la stessa Anthropic: coordinare un blocco a livello mondiale è quasi un’utopia. Servirebbe che più laboratori, ben finanziati e sparsi in diversi paesi, accettassero di fermarsi tutti insieme e alle stesse condizioni. E che ognuno potesse verificare che gli altri si siano davvero fermati per davvero. “I training run sono molto più facili da nascondere dei silos missilistici”, scrivono Favaro e Clark, con un’immagine che rende benissimo l’idea.
C’è poi un’obiezione strutturale, sollevata sempre dall’azienda: “Se un rallentamento lascia semplicemente che gli attori meno cauti recuperino terreno tecnologicamente, potrebbe rendere tutti meno sicuri.” Tradotto: frenare da soli rischia di peggiorare le cose, regalando il vantaggio proprio a chi della sicurezza se ne infischia.
Non mancano le critiche, naturalmente. Diversi esperti del settore accusano Anthropic di gonfiare le capacità attuali dell’AI o di costruire narrative allarmistiche per spingere regolamentazioni che danneggerebbero i concorrenti. È un sospetto da tenere a mente, leggendo un documento del genere firmato da chi ha tutto l’interesse a scrivere le regole del gioco. La realtà è che noi “pesci piccoli” non abbiamo gli strumenti per giudicare fino in fondo, e la stessa proposta di Anthropic porta con sé effetti collaterali che, con ogni probabilità, la condanneranno a un nulla di fatto. Ma almeno, quando Skynet prenderà il controllo, Anthropic potrà dire di averlo predetto.