Immagina un cervellone artificiale capace di parlare, ragionare e risolvere problemi… ma senza bisogno di un supercomputer per funzionare. Ecco, questo è BitNet b1.58 2B4T, il nuovo modello linguistico presentato da Microsoft, ed è molto più interessante di quanto sembri a prima vista.
Microsoft presenta BitNet
Partiamo da quello che lo rende davvero speciale: mentre la maggior parte dei modelli AI usa numeri complicati – tipo quelli a 16 o 32 bit – per rappresentare ogni singola connessione al suo interno, BitNet lavora con una specie di linguaggio in codice ridottissimo. I suoi “pesi” sono solo tre: -1, 0 e +1. Fine. Una scelta che può sembrare minimalista, ma che in realtà è un colpo di genio. Con questo sistema chiamato quantizzazione ternaria, ogni informazione occupa appena 1,58 bit. Il risultato? Un modello super compatto, che ha bisogno di molta meno memoria e può girare su hardware “normale”, senza GPU ultrapotenti o server da migliaia di euro.
Ma la parte davvero sorprendente è che funziona anche bene. Nonostante la sua struttura semplificata, BitNet ha due miliardi di parametri ed è stato addestrato su una quantità di dati enorme: parliamo di quattro trilioni di parole e simboli, l’equivalente di qualcosa come 33 milioni di libri. E questo training intensivo lo ha reso in grado di competere (e in certi casi battere) modelli di altre grandi aziende come Meta, Google e Alibaba.
Anche nei test su compiti pratici – tipo risolvere problemi di logica o rispondere con buon senso – BitNet ha mostrato muscoli. E lo ha fatto usando meno di 400 megabyte di memoria. Per farti un’idea, è meno di quello che occupa un singolo video in alta qualità sul tuo telefono.
Tutto questo è possibile grazie a un framework sviluppato ad hoc, chiamato bitnet.cpp. È come il motore che permette a questo modello di correre leggero e veloce anche su una semplice CPU, tipo quella di un MacBook con chip M2. Certo, per ora ci sono ancora dei limiti – come una finestra di contesto più corta e una compatibilità ristretta – ma i ricercatori sono già al lavoro per estendere il supporto a più lingue e a input più lunghi.
In pratica, BitNet è la dimostrazione che l’intelligenza artificiale non deve per forza essere gigante, costosa e affamata di energia. A volte, meno è davvero di più.