Le antiche iscrizioni sono tra le fonti più preziose per ricostruire quanto accaduto nel passato. Interpretarle, però, si rivela spesso un’impresa ardua. Molte di esse giungono incomplete, rovinate dagli agenti atmosferici o prive del loro contesto originale. Tale condizione rende necessario un lungo lavoro di analisi da parte degli studiosi. Ma la tecnologia, in particolare l’intelligenza artificiale, sta offrendo strumenti rivoluzionari in grado di trasformare tale campo di studi. Un esempio emblematico di tale evoluzione è Aeneas, un avanzato sistema AI messo a punto da Google DeepMind. Non si tratta di un semplice programma di riconoscimento del testo. È stato pensato come un vero compagno di lavoro. In grado di interpretare le iscrizioni con un approccio che unisce linguistica, filologia e storia.
Google Aeneas: ecco come funziona
Ogni iscrizione analizzata viene trasformata in una sorta di “impronta digitale storica”. Un insieme complesso di informazioni che comprende non solo il contenuto del testo. Ma anche aspetti legati alla sua struttura sintattica, alle formule linguistiche tipiche di determinati periodi o aree geografiche, e ai collegamenti con altri reperti già catalogati. Ciò permette a Google Aeneas di collocare frammenti apparentemente oscuri all’interno di un quadro molto più ampio.
Per raggiungere tale livello di sofisticazione, il modello è stato istruito su un’enorme banca dati contenente oltre 176.000 iscrizioni latine. Tale corpus rappresenta il frutto di decenni di studi da parte di epigrafisti di tutto il mondo. La capacità di Google Aeneas di riconoscere pattern ricorrenti o individuare somiglianze sottili consente agli studiosi di ottenere suggerimenti preziosi anche per testi molto deteriorati o isolati.
Un altro aspetto importante del progetto di Google è la sua apertura alla comunità scientifica. DeepMind ha scelto di rendere Aeneas open source, con una versione interattiva disponibile online per ricercatori, docenti e appassionati. Inoltre, sia il codice che i dati su cui il modello è stato addestrato sono stati pubblicati sulla piattaforma GitHub, a disposizione di chiunque voglia contribuire a migliorare o ampliare il sistema.
