Nel settore dell’intelligenza artificiale applicata alla robotica, Google DeepMind ha segnato un nuovo passo avanti. Ciò con l’introduzione dei modelli Gemini Robotics 1.5, una piattaforma che sembra ridefinire i confini dell’autonomia e della pianificazione meccanica. Presentati pubblicamente in un video il 25 settembre, i nuovi sistemi mostrano un’evoluzione rispetto alle precedenti generazioni. Concentrandosi sulla capacità dei robot di gestire compiti complessi e multi-step. L’esperimento che più di altri ha attirato l’attenzione dei ricercatori è stato soprannominato “banana test”. Qui, il braccio robotico Franka non solo ha riconosciuto tre frutti differenti, ma li ha anche smistati in base al colore e collocati nei piatti corretti.
Google DeepMind: ecco i progressi nella robotica
In un secondo contesto sperimentale, il robot umanoide Apollo, sviluppato da Apptronik, ha affrontato un compito domestico apparentemente banale: dividere capi di biancheria per colore in due ceste. Durante l’operazione, gli ingegneri hanno spostato intenzionalmente le ceste, introducendo un elemento di incertezza. Apollo ha reagito con prontezza, ricalcolando il percorso e completando il compito con successo.
La differenza rispetto al passato risiede nella logica di funzionamento dei nuovi modelli. Il sistema Gemini Robotics-ER 1.5 non si limita a tradurre input visivi in comandi motori, ma pianifica una sequenza di azioni coerente con un obiettivo complessivo. Manifestando così un rudimentale senso di razionalità procedurale.
Uno degli aspetti più discussi riguarda l’introduzione delle cosiddette “capacità agentiche”. Un concetto con cui DeepMind descrive la possibilità per i robot di esplorare l’ambiente, acquisire informazioni e prendere decisioni autonome. In prospettiva, un sistema di questo tipo potrebbe gestire compiti più articolati, come la selezione dei rifiuti, consultando online le regole di smaltimento specifiche di un’area e pianificando di conseguenza le azioni da eseguire. Non si tratterebbe più, dunque, di semplici esecutori, ma di agenti intelligenti capaci di interpretare obiettivi e strategie.
Parallelamente, Google ha sottolineato l’impegno verso la sicurezza. I modelli Gemini 1.5 sono stati progettati per identificare potenziali rischi prima dell’azione. Ciò rispettando normative e limitando le possibilità di errore. A confermare l’efficacia di questo approccio è il punteggio ottenuto nei test ASIMOV, un benchmark che valuta l’affidabilità dei sistemi robotici, dove la nuova architettura ha raggiunto i vertici di categoria. Il progresso mostrato da DeepMind apre scenari che vanno oltre la semplice automazione. La sfida futura sarà garantire che tali intelligenze meccaniche si integrino in modo etico e sicuro nella quotidianità umana.
