Apple Intelligence poggia su un’infrastruttura più articolata di quanto si potesse immaginare, e nelle ore a ridosso del keynote di apertura della WWDC 2026 Craig Federighi ha voluto mettere alcuni puntini sulle i. Durante una sessione aggiuntiva, il dirigente di Apple ha spiegato come funzionano davvero i nuovi modelli AI dell’azienda e, soprattutto, quale sia stato il contributo di Google in tutta la faccenda. La risposta, in soldoni, è che Google ha lavorato dietro le quinte, senza mai prendersi la scena.
Federighi è stato chiaro su un punto che circolava da tempo come ipotesi: Apple non usa i modelli Gemini pensati per il grande pubblico, né il codice delle app di Google. E nemmeno l’infrastruttura del motore di ricerca finisce per fare da fonte principale alle informazioni che alimentano i sistemi di Cupertino. Insomma, niente scorciatoie evidenti.
I cinque modelli che muovono Apple Intelligence
Il vero motore di tutto è la nuova famiglia di AFM (Apple Foundational Models), cinque modelli pensati per compiti diversi. Due lavorano direttamente sul dispositivo, sfruttando la potenza dei chip Apple Silicon. Il primo si chiama AFM Core ed è un modello generalista di nuova generazione. Il secondo, AFM Core Advanced, porta un’architettura più sofisticata e capacità multimodali: riesce a maneggiare testo, immagini e altri contenuti tutti insieme, senza bisogno di passare dal cloud.
Gli altri tre modelli, invece, vivono nell’infrastruttura cloud privata di Apple. C’è AFM Cloud, tarato sulle richieste a bassa latenza, e AFM Cloud Image, dedicato alla generazione e alla modifica delle immagini. Il pezzo grosso è AFM Cloud Pro, costruito per le attività più complesse, il ragionamento avanzato e l’uso di strumenti esterni. Ed è proprio qui, nella messa a punto di questi modelli, che entra in gioco la tecnologia di Google.
La distillazione e il ruolo concreto di Google
Apple ha raccontato di aver sviluppato i propri sistemi partendo da dati proprietari e tecniche di apprendimento avanzato. Ma una parte del lavoro di rifinitura è passata attraverso gli output dei modelli Gemini più evoluti. La tecnica si chiama distillazione: in pratica un modello si appoggia ai risultati prodotti da un altro per migliorare le proprie prestazioni, senza però portarsi dentro né il codice né l’architettura altrui. È un metodo che può creare qualche grattacapo dal punto di vista delle polemiche: basti pensare a quando OpenAI aveva accusato DeepSeek di aver sostanzialmente distillato ChatGPT per costruire il suo celebre modello R1.