Dopo un lavoro durato parecchio tempo, Alibaba ha tirato fuori dal cassetto Qwen-Robot, una nuova famiglia di modelli pensata per dare ai robot la capacità di capire cosa hanno intorno e agire da soli, senza bisogno di un controllo costante. Si tratta in sostanza di intelligenza artificiale, ma di tipo molto particolare, tagliata su misura per questo settore e quindi diversa da quella che fa girare i chatbot che ormai usiamo tutti i giorni.
A occuparsi dello sviluppo è stato il Tongyi Lab, il laboratorio interno del colosso cinese. Per ora il progetto si trova ancora in una fase di test, con alcuni clienti aziendali che lavorano già su Alibaba Cloud. La suite non è un blocco unico, ma un insieme di tre modelli distinti, ciascuno specializzato in un aspetto preciso di quella che viene chiamata intelligenza fisica. In pratica si è cercato di scomporre il problema in più parti, perché muoversi nel mondo reale è una faccenda complicata che un singolo modello difficilmente riuscirebbe a gestire.
Tre modelli per tre compiti diversi
Il primo si chiama Qwen-RobotNav ed è quello che si occupa della navigazione e degli spostamenti. In sostanza serve al robot per capire dove si trova e come arrivare dove deve andare. Il secondo è Qwen-RobotManip, dedicato invece alla manipolazione degli oggetti, ovvero tutta quella parte fatta di prendere, spostare, afferrare le cose senza farle cadere o romperle. Il terzo, forse il più curioso, è Qwen-RobotWorld, che funziona come una specie di modello del mondo. Il suo compito è prevedere come cambieranno gli ambienti e quali saranno gli effetti delle azioni del robot prima ancora che queste vengano compiute.
L’idea di fondo è abbastanza chiara. I modelli linguistici e multimodali che già conosciamo sanno spiegare benissimo come portare a termine un’attività, descrivono passo passo cosa fare. Il problema arriva dopo, perché tradurre quelle parole in movimenti veri, fisici, concreti richiede tutta un’altra serie di competenze. Sapere a parole come si versa un bicchiere d’acqua è una cosa, riuscire a farlo davvero con un braccio meccanico è tutta un’altra storia.
Ed è proprio qui che entra in gioco la robotica targata Alibaba. L’obiettivo dichiarato è permettere alle macchine di interpretare le istruzioni che ricevono, comprendere ciò che vedono attraverso i loro sensori e poi passare all’azione. Muoversi nello spazio, interagire con gli oggetti che hanno davanti e, soprattutto, anticipare le conseguenze di quello che stanno per fare. Questa capacità di previsione è il punto più delicato di tutto il sistema, perché un robot che non sa cosa accadrà dopo un suo gesto rischia di combinare guai.