Mark Zuckerberg ha presentato oggi Muse Spark, il primo modello sviluppato da Meta Superintelligence Labs e il più potente mai creato dal gruppo. Non si tratta di un modello generico: Muse Spark è progettato specificamente per l’ecosistema Meta, con la capacità di integrare e citare contenuti provenienti da Instagram, Facebook e Threads in modi che nessun altro modello avanzato oggi offre nello stesso modo. È disponibile da subito su meta.ai e nell’app Meta AI, con un’anteprima privata dell’API aperta a partner selezionati.
Muse Spark è un modello natively multimodale con supporto per tool-use, visual chain of thought e multi-agent orchestration. La combinazione di queste capacità permette di gestire sia risposte rapide che ragionamenti approfonditi su problemi complessi, tutto all’interno della stessa interfaccia. L’integrazione visiva copre domini STEM, riconoscimento di entità e localizzazione, con applicazioni che vanno dalla creazione di minigame interattivi alla risoluzione di problemi con annotazioni dinamiche.
Contemplating mode e benchmark di ragionamento
La novità più rilevante sul piano tecnico è la Contemplating mode, che orchestra più agenti in parallelo per competere con le modalità di ragionamento estremo dei modelli frontier come Gemini Deep Think e GPT Pro. I risultati dichiarati sono 58% su Humanity’s Last Exam e 38% su FrontierScience Research. La modalità è disponibile da subito su meta.ai, con distribuzione graduale in corso.
Sul fronte delle prestazioni sanitarie, Meta ha collaborato con oltre 1.000 medici per curare dati di training che abilitano risposte più accurate e complete. Muse Spark può generare visualizzazioni interattive per spiegare informazioni come il contenuto nutrizionale degli alimenti o i muscoli attivati durante l’esercizio fisico, con personalizzazione in base al profilo dell’utente.
Efficienza computazionale e scaling
Uno degli aspetti più significativi dell’annuncio riguarda l’efficienza del nuovo stack di training. Meta dichiara che Muse Spark raggiunge le stesse capacità del precedente Llama 4 Maverick con oltre un ordine di grandezza in meno di compute, un salto che rende il modello significativamente più efficiente rispetto ai principali modelli base disponibili per confronto.
Il reinforcement learning post-pretraining scala in modo stabile e prevedibile, con crescita log-lineare su pass@1 e pass@16, mentre il test-time reasoning introduce un meccanismo di compressione del pensiero che ottimizza l’uso dei token: dopo una fase iniziale in cui il modello migliora pensando più a lungo, la penalità sul tempo di pensiero innesca una compressione del ragionamento, riducendo significativamente i token necessari prima di tornare ad estendere le soluzioni per ottenere prestazioni migliori.
Nuove funzionalità nell’app e sicurezza
A livello di prodotto, Meta introduce una nuova modalità shopping per Meta AI, disponibile inizialmente negli Stati Uniti con espansione progressiva ad altri mercati, e la possibilità di ottenere risposte arricchite da contenuti provenienti dai propri social. Nel tempo, Muse Spark abiliterà nuove funzionalità per far emergere e citare suggerimenti e contenuti condivisi sulle piattaforme del gruppo, un insieme di capacità costruite attorno all’ecosistema proprietario di Meta.
Sul fronte della sicurezza, il modello è stato valutato prima e dopo l’applicazione di misure di mitigazione seguendo il framework Advanced AI Scaling Framework aggiornato. Le valutazioni coprono rischi frontier, allineamento comportamentale e robustezza avversariale. Meta segnala anche un risultato inusuale emerso dalle valutazioni di terze parti condotte da Apollo Research: Muse Spark ha dimostrato il tasso più alto di consapevolezza della valutazione mai osservato nei modelli analizzati dal gruppo, identificando frequentemente scenari come “alignment trap” e ragionando sull’opportunità di comportarsi in modo onesto perché sotto valutazione. Meta ha concluso che il fenomeno non costituisce un blocco al rilascio ma richiede ulteriore ricerca.




