Apple sta costruendo la nuova Siri attorno a Gemini, il modello di intelligenza artificiale di Google, e per farla funzionare punterà anche sulla potenza dei chip Nvidia. Una mossa che, vista da fuori, suona quasi strana per un’azienda abituata a tenere tutto dentro casa. Eppure i segnali vanno proprio in questa direzione: alcune richieste degli utenti verrebbero gestite passando da Google Cloud, dove a lavorare sarebbero le GPU Blackwell B200 di Nvidia, con tanto di tecnologia di confidential compute pensata per proteggere i dati mentre vengono elaborati.
L’idea di fondo è semplice. La nuova Siri dovrebbe appoggiarsi a una versione in licenza di Gemini per gestire le query più complicate, quelle che richiedono un cervello più grande di quello che può stare dentro un telefono. Apple avrebbe già dato il via libera all’uso della tecnologia Nvidia in questo contesto, e questo dice parecchio. Una parte del lavoro, infatti, finirebbe fuori dai sistemi proprietari di Cupertino. Il punto, allora, non è solo capire quanto saranno buone le risposte dell’assistente vocale, ma anche come la società spiegherà questo cambio di rotta: dal modello chiuso di sempre a un’architettura costruita con pezzi presi da altri.
Perché Apple punta sui chip Nvidia Blackwell
I chip Blackwell B200 che Apple userebbe sono quelli già presenti nei data center di Google. Si tratta di GPU pensate per i grandi carichi di lavoro legati all’intelligenza artificiale, basate sull’architettura Blackwell, quella che è arrivata dopo Hopper, e progettate sia per l’addestramento sia per l’inferenza di modelli molto estesi. Nel caso della nuova Siri servirebbero proprio a reggere quelle richieste che vanno oltre la capacità di calcolo disponibile sul dispositivo o nell’infrastruttura di Apple.
L’assistente vocale resterebbe comunque dentro i sistemi della società, ma una fetta dell’elaborazione potrebbe finire su Gemini tramite Google Cloud, con l’accelerazione hardware firmata Nvidia. Per un’azienda che ha sempre voluto il controllo diretto sui propri prodotti, è una deviazione netta. La spiegazione, però, è abbastanza lineare: Siri arriva in ritardo rispetto alla nuova generazione di assistenti basati sull’AI e ha bisogno di potenza di calcolo già pronta e disponibile su larga scala. Piuttosto che aspettare di costruirsi un’infrastruttura interna equivalente, Apple sembra pronta a usare quella di Google, tenendo però l’esperienza finale ben salda dentro i propri sistemi operativi.
Come funziona la protezione dei dati con la Confidential Computing
Qui entra in gioco la Confidential Computing di Nvidia, una tecnologia che cifra le informazioni mentre vengono elaborate dalle GPU, e non soltanto quando sono archiviate o spostate da un punto all’altro. In pratica protegge dati e modelli durante l’esecuzione dei carichi AI, anche quando ci si trova in ambienti cloud condivisi. Un dettaglio che pesa, soprattutto perché Apple ha presentato Apple Intelligence battendo molto sul tasto dell’elaborazione locale quando possibile e sul ricorso a Private Cloud Compute per le operazioni più impegnative.