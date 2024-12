L’intelligenza artificiale (AI) si nutre di dati, ma non basta avere semplicemente una grande quantità di informazioni; la qualità di questi dati è fondamentale per garantire che i modelli possano svilupparsi in modo efficace. Tuttavia, uno degli ostacoli principali che gli sviluppatori di AI incontrano è la carenza di dati di alto livello. Per rispondere a questa esigenza, la Harvard Law School ha dato il via all’Institutional Data Initiative (IDI), un progetto pensato per aumentare l’accesso a dati di qualità, non solo per chi lavora con l’intelligenza artificiale, ma anche per chi opera in altri settori.

La raccolta di dati di qualità di Harvard per l’AI

L’iniziativa si propone di collaborare con diverse istituzioni, come biblioteche, università e agenzie governative, per aiutare a trasformare le loro collezioni in dati strutturati e facilmente accessibili. Una delle prime mosse è stata rendere disponibili milioni di libri di pubblico dominio scansionati dalla biblioteca di Harvard, molti dei quali fanno parte del progetto Google Books, insieme a un vasto archivio di giornali storici, sviluppato in collaborazione con la biblioteca pubblica di Boston. Per questi ultimi, sono state create soluzioni speciali per estrarre il testo degli articoli, in modo da migliorarne l’accuratezza e l’accessibilità.

L’idea dietro l’IDI è che offrire accesso a dati di qualità stimoli l’innovazione, aprendo la strada alla creazione di nuovi modelli di AI e dando spazio a nuovi attori nel settore. Ma non si ferma qui: la ricerca si sta anche concentrando sull’espansione dell’accesso ai dati scientifici e biomedici, un altro settore in cui la qualità dei dati può fare una grande differenza.

A supportare questa iniziativa ci sono grandi nomi come Microsoft, Google e OpenAI, che riconoscono l’importanza di garantire l’accesso a una vasta gamma di dati. La varietà di informazioni, che riflette diverse lingue e culture, è vista come un elemento cruciale per lo sviluppo di un’intelligenza artificiale che sia davvero inclusiva, in grado di rappresentare tutte le comunità.

Entro la primavera del 2025, Harvard ospiterà un simposio per mettere insieme esperti accademici e tecnologi, discutendo le modalità per sfruttare al meglio i dati resi disponibili attraverso l’IDI e garantire che i benefici dell’iniziativa siano condivisi a livello globale.