E se lo sviluppo di un mondo di giochi 3D fosse facile come scattare foto con il tuo telefono? I ricercatori di Nvidia hanno recentemente sviluppato un sistema di intelligenza artificiale in grado di prevedere un modello 3D completo da qualsiasi immagine 2D.
Chiamata “DIB-R“, l’IA scatta una foto di qualsiasi oggetto 2D, ad esempio l’immagine di un uccello, e predice come sarebbe in tre dimensioni. Questa previsione include illuminazione, trama e profondità.
Nvidia: qual è il significato della denominazione DIB-R e le considerazioni di Nvidia riguardo lo strumento
DIB-R sta per renderizzatore differenziabile basato su interpolazione, nel senso che combina ciò che “vede”, un’immagine 2D, e fa inferenze basate su una “comprensione” 3D del mondo. Ciò è sorprendentemente simile al modo in cui gli umani traducono l’input 2D dai nostri occhi in un’immagine mentale 3D.
Secondo Nvidia , questa ricerca ha numerose implicazioni per il campo della robotica: “Perché un robot autonomo possa interagire in modo sicuro ed efficiente con il proprio ambiente, deve essere in grado di percepire e comprendere ciò che lo circonda. DIB-R potrebbe potenzialmente migliorare quelle capacità di percezione della profondità“.
Con un ulteriore sviluppo i ricercatori sperano di espandere DIB-R per includere funzionalità che lo renderebbero essenzialmente un renderizzatore di realtà virtuale. Un giorno, il team spera, un tale sistema consentirà all’intelligenza artificiale di creare mondi 3D completamente immersivi in millisecondi usando solo fotografie.
La capacità di rendere il mondo dalle fotografie potrebbe portare a incredibili condotte per la creazione di contenuti. Tecnologie come Google Maps potrebbe diventare più coinvolgente che mai. E, possibilmente, i creativi più abili nella fotografia o nella pittura rispetto alla programmazione e allo sviluppo potrebbero lasciare tutto lo sviluppo pesante alle macchine.