L’AI sta facendo grandi passi anche qui in Italia, con un risultato di rilievo raggiunto dal team di ricerca Sapienza NLP. Presentiamo Minerva, la primissima serie di modelli linguistici di ampia portata addestrati specificamente per l’italiano.
L’intelligenza artificiale ora parla italiano
Questo insieme di LLM (Large Language Model) è stato creato “da zero” dal gruppo capitanato dal professor Roberto Navigli, del dipartimento di Ingegneria Informatica, Automatica e Gestionale “Antonio Ruberti” presso l’Università La Sapienza di Roma. Questa notizia segna un traguardo importante per l’avanzamento dell’AI nel nostro paese.
Oltre al professor Navigli, il progetto Minerva vede la partecipazione dei due giovani ricercatori Edoardo Barba e Simone Conia, con il sostegno cruciale di una associazione internazionale di linguistica computazionale. I modelli linguistici Minerva sono stati costruiti e addestrati da zero utilizzando testi disponibili online, distinguendosi così dai modelli italiani preesistenti adattati da Mistral ed LLaMA. Minerva ha assimilato dati sia in inglese che in italiano, provenienti da fonti documentali online, totalizzando l’enorme quantità di 500 miliardi di parole, equiparabile a circa 5 milioni di romanzi.
L’obiettivo principale del team della Sapienza di Roma è fornire uno strumento utile e altamente performante per la comprensione del linguaggio naturale, la generazione di testi, la traduzione automatica e l’assistenza clienti automatizzata.
Il modello Minerva e la sua distribuzione
Questo nuovo strumento sarà di grande valore per le aziende, gli sviluppatori e i ricercatori, rivoluzionando l’ambito dell’intelligenza artificiale italiana. I modelli sono già disponibili in anteprima per la comunità scientifica FAIR (Future Artificial Intelligence Research) e saranno rilasciati al pubblico nelle prossime settimane in una versione completa e avanzata, che includerà anche la possibilità di interagire con l’AI in italiano.
Va ricordato che dal mese di febbraio è disponibile anche noplagio.it, un altro strumento AI progettato per il riconoscimento dei testi in italiano, con un incredibile tasso di precisione del 99,7%.