Una decisione che cambia gli equilibri tra due dei nomi più pesanti della tecnologia. Google avrebbe imposto un freno all’utilizzo del proprio modello Gemini da parte di Meta, e il motivo è tanto semplice quanto significativo. Il gruppo guidato da Mark Zuckerberg avrebbe spinto talmente tanto sull’acceleratore da superare la capacità di calcolo che gli era stata messa a disposizione. Un po’ come succede agli utenti gratuiti quando esagerano con un chatbot e si ritrovano bloccati, solo che qui parliamo di una scala completamente diversa.
Quando la potenza di calcolo non basta più
Il nocciolo della questione va ben oltre il rapporto tra le due aziende. Quello che emerge è un dato che fa riflettere parecchio, ovvero la domanda di infrastrutture dedicate all’intelligenza artificiale sta crescendo a un ritmo che le strutture esistenti faticano a reggere. I data center non si moltiplicano alla stessa velocità con cui aumentano le richieste, e questo mette in difficoltà perfino i giganti del settore. Sì, anche un colosso come Google, che di server e potenza di calcolo dovrebbe averne in abbondanza, si trova a dover razionare.
Le indiscrezioni parlano di un avvertimento arrivato già nel mese di marzo. Google avrebbe comunicato a Meta che non era più in grado di sostenere ulteriori richieste di elaborazione, almeno non senza conseguenze. La reazione interna non si è fatta attendere. L’azienda di Zuckerberg avrebbe chiesto ai propri dipendenti di gestire i token con maggiore attenzione, riducendo gli sprechi nelle interrogazioni ai modelli linguistici. Tradotto in parole povere, meno richieste a vuoto e più efficienza in ogni singola operazione.
Perché Meta usa Gemini pur avendo Llama
C’è un aspetto che potrebbe sembrare curioso. Meta possiede già una sua famiglia di modelli, ovvero Llama, eppure continua ad appoggiarsi a Gemini per una lunga lista di attività. Non si tratta di operazioni marginali. Parliamo del supporto clienti, dei chatbot pensati per gli inserzionisti, dell’assistenza nella scrittura di codice software. E ancora, sistemi che servono a rimuovere i contenuti dannosi dalle piattaforme e strumenti dedicati a stanare le truffe online, un fronte sempre più delicato.
Questo spiega perché il limite imposto da Google non sia una semplice formalità burocratica. Meta dipende da quella tecnologia per far girare servizi che toccano milioni di persone ogni giorno, sia gli utenti finali sia chi investe in pubblicità sulle sue piattaforme. Ritrovarsi con un tetto sull’utilizzo significa dover ripensare priorità e flussi di lavoro, almeno finché la situazione delle infrastrutture non si stabilizza.
La vicenda racconta bene quanto sia diventata preziosa la capacità di calcolo in questa fase. Non è più solo una questione di chi ha il modello migliore, ma di chi riesce davvero a farlo funzionare su larga scala senza inciampare nei propri stessi limiti fisici. E quando due aziende di questo peso si trovano a negoziare sui token disponibili, è chiaro che il vero collo di bottiglia non sono le idee, ma le macchine che devono trasformarle in realtà.