
În câteva cuvinte
Cercetătorii explorează utilizarea inteligenței artificiale pentru a crea roboți mai capabili și mai adaptabili. Există dezbateri cu privire la fezabilitatea și rapiditatea cu care IA poate transforma robotica, dar există un consens că IA va avea un impact semnificativ asupra acestui domeniu. Provocările includ colectarea datelor din lumea reală, crearea de simulări realiste și dezvoltarea de rețele neuronale care pot procesa mai bine spațiul și timpul.
Chelsea Finn (stânga) și Moo Jin Kim fac o demonstrație cu un robot la Universitatea Stanford.
Inteligența artificială poate găsi o rețetă sau genera o imagine, dar nu poate agăța un tablou pe perete sau să-ți gătească cina. Chelsea Finn vrea ca acest lucru să se schimbe. Finn, inginer și cercetător la Universitatea Stanford, consideră că inteligența artificială (IA) ar putea fi pe punctul de a alimenta o nouă eră în robotică. "Pe termen lung, dorim să dezvoltăm software care să permită roboților să funcționeze inteligent în orice situație", spune ea. O companie pe care a co-fondat-o a demonstrat deja un robot AI de uz general care poate împături rufe, printre alte sarcini. Alți cercetători au demonstrat potențialul IA de a îmbunătăți capacitatea roboților de a face orice, de la sortarea coletelor până la cursele cu drone. Iar Google tocmai a dezvăluit un robot bazat pe inteligența artificială care ar putea împacheta un prânz.
Dar comunitatea de cercetare este împărțită în ceea ce privește capacitatea instrumentelor de IA generativă de a transforma robotica așa cum au transformat unele munci online. Roboții necesită date din lumea reală și se confruntă cu probleme mult mai dificile decât chatbot-urile.
"Roboții nu vor deveni brusc acest vis științifico-fantastic peste noapte", spune Ken Goldberg, profesor la UC Berkeley. "Este foarte important ca oamenii să înțeleagă asta, pentru că nu am ajuns încă acolo."
Vise și dezamăgiri
Există puține părți ale științei și ingineriei care au un decalaj mai mare între așteptări și realitate decât robotica. Chiar cuvântul "robot" a fost inventat de Karel Čapek, un scriitor ceh care, în anii 1920, a scris o piesă care imagina ființe asemănătoare omului care ar putea îndeplini orice sarcină pe care o comandă proprietarul lor.
În realitate, roboții au avut mari dificultăți în a face chiar și sarcini banale. Mașinile sunt la maximum când efectuează mișcări extrem de repetitive într-un mediu atent controlat – de exemplu, pe o linie de asamblare auto în interiorul unei fabrici – dar lumea este plină de obstacole neașteptate și obiecte neobișnuite.
În laboratorul lui Finn de la Universitatea Stanford, studentul absolvent Moo Jin Kim demonstrează modul în care roboții bazați pe inteligența artificială au cel puțin potențialul de a rezolva unele dintre aceste probleme. Kim a dezvoltat un program numit "OpenVLA", care înseamnă Viziune, Limbaj, Acțiune (Vision, Language, Action).
"Este un pas în direcția ChatGPT pentru robotică, dar mai sunt încă multe de făcut", spune el.
Moo Jin Kim configurează un robot bazat pe inteligență artificială la Universitatea Stanford.
Robotul în sine pare destul de banal, doar o pereche de brațe mecanice cu clești. Ceea ce îl face diferit este ceea ce se află în interior. Roboții obișnuiți trebuie programați cu atenție. Un inginer trebuie să scrie instrucțiuni detaliate pentru fiecare sarcină. Dar acest robot este alimentat de o rețea neuronală AI care poate fi învățată. Rețeaua neuronală funcționează așa cum oamenii de știință cred că ar putea funcționa creierul uman – "nodurile" matematice din rețea au miliarde de conexiuni între ele într-un mod similar cu modul în care neuronii din creier sunt conectați împreună. "Programarea" unei astfel de rețele se referă pur și simplu la consolidarea conexiunilor care contează și la slăbirea celor care nu contează. În practică, asta înseamnă că Kim poate antrena modelul OpenVLA cum să facă o grămadă de sarcini diferite, pur și simplu arătându-i.
La robot sunt atașate o pereche de joystick-uri care controlează fiecare braț. Pentru a-l antrena, un operator uman folosește joystick-urile pentru a "manevra" robotul în timp ce îndeplinește o sarcină dorită.
"Practic, orice sarcină vrei să o facă, o faci din nou și din nou, de 50 sau 100 de ori", spune el.
Această repetiție este tot ce este necesar. Conexiunile dintre nodurile din rețeaua neuronală AI a robotului sunt consolidate de fiecare dată când i se arată acțiunea. În curând, poate repeta sarcina fără păpușar.
Pentru a demonstra, Kim scoate o tavă cu diferite tipuri de amestec de fructe uscate și nuci. L-a învățat deja cum să ia cu lingura. Acum vreau niște amestec care are M&M verzi și nuci, și tot ce trebuie să fac este să cer.
"Ia cu lingura niște din cele verzi cu nuci în castron", tastez. Foarte încet, brațele robotului tresar în acțiune.
Pe un flux video, OpenVLA plasează o stea peste recipientul corect. Asta înseamnă că prima parte a modelului, care trebuie să preia textul meu și să-i interpreteze vizual sensul, a funcționat corect.
Nu se întâmplă întotdeauna, spune Kim. "Aceasta este partea în care ne ținem respirația."
Apoi, încet, ezitant, întinde gheara, ridică lingura și ia amestecul.
"Se pare că funcționează!" spune Kim entuziasmat.
Este o lingură foarte mică. Dar o lingură în direcția corectă.
Orice fel de roboți
Cercetătoarea de la Stanford, Chelsea Finn, a co-fondat o companie în San Francisco numită Physical Intelligence, care încearcă să ducă această abordare de antrenament la nivelul următor.
Ea își imaginează o lume în care roboții se pot adapta rapid pentru a face sarcini simple, cum ar fi prepararea unui sandviș sau reaprovizionarea rafturilor cu alimente. Contrar gândirii actuale despre robotică, ea bănuiește că cea mai bună cale de a ajunge acolo ar putea fi antrenarea unui singur model pentru a face o mulțime de sarcini diferite.
"De fapt, credem că încercarea de a dezvolta sisteme generaliste va avea mai mult succes decât încercarea de a dezvolta un sistem care face un singur lucru foarte, foarte bine", spune ea.
Physical Intelligence a dezvoltat o rețea neuronală AI care poate împături rufe, poate lua cafea boabe cu lingura și poate asambla o cutie de carton, deși rețeaua neuronală care îi permite să facă toate aceste lucruri este prea puternică pentru a fi fizic pe robotul însuși.
"În acest caz, am avut de fapt o stație de lucru care se afla în apartament și care calcula acțiunile și apoi le trimitea prin rețea către robot", spune ea.
Dar următorul pas – compilarea datelor de antrenament pentru programul său AI pentru roboți – este o sarcină mult mai dificilă decât simpla colectare a textului de pe internet pentru a antrena un chatbot.
"Este foarte greu", recunoaște Finn. "Nu avem un internet deschis cu date despre roboți, așa că de multe ori se reduce la colectarea datelor noi înșine de la roboți."
Totuși, Finn crede că este fezabil. Pe lângă antrenorii umani, roboții pot, de asemenea, să încerce în mod repetat să facă sarcini pe cont propriu și să-și construiască rapid baza de cunoștințe, spune ea.
Dilema datelor
Dar Ken Goldberg de la Berkley este mai sceptic că decalajul din lumea reală poate fi depășit rapid. Chatboții AI s-au îmbunătățit masiv în ultimii doi ani, deoarece au avut o cantitate imensă de date din care să învețe. De fapt, au absorbit cam tot internetul pentru a se antrena cum să scrie propoziții și să deseneze imagini.
Ken Goldberg co-fondator la Ambi Robotics și profesor la UC Berkeley.
Doar construirea unei cantități de date din lumea reală echivalente cu internetul pentru roboți va merge mult mai lent. "În ritmul actual, vom avea nevoie de 100.000 de ani pentru a obține atât de multe date", spune el.
"Aș spune că aceste modele nu vor funcționa așa cum sunt antrenate astăzi", este de acord Pulkit Agrawal, cercetător în robotică la MIT.
Agrawal este un susținător al simulării: punerea rețelei neuronale AI care rulează robotul într-o lume virtuală și permiterea acestuia să repete sarcinile din nou și din nou.
"Puterea simulării este că putem colecta cantități foarte mari de date", spune el. "De exemplu, în trei ore de simulare, putem colecta 100 de zile de date."
Această abordare a funcționat bine pentru cercetătorii din Elveția care au antrenat recent o dronă cum să concureze, punându-i creierul alimentat de inteligența artificială într-un simulator și rulând-o pe un traseu prestabilit din nou și din nou. Când a ajuns în lumea reală, a reușit să zboare pe traseu mai repede și mai bine decât un adversar uman calificat, cel puțin o parte din timp.
Dar simularea are dezavantajele ei. Drona a funcționat destul de bine pentru un traseu interior. Dar nu a putut face față la nimic care nu a fost simulat – vântul, ploaia sau lumina soarelui – ar putea scoate drona de pe traseu.
Și zborul și mersul sunt sarcini relativ simple de simulat. Goldberg spune că, de fapt, ridicarea obiectelor sau efectuarea altor sarcini manuale pe care oamenii le consideră complet simple sunt mult mai greu de reprodus într-un computer. "Practic, nu există niciun simulator care să poată modela cu exactitate manipularea", spune el.
Înțelegerea problemei
Unii cercetători cred că, chiar dacă problema datelor poate fi depășită, probleme mai profunde pot afecta roboții AI.
"În mintea mea, întrebarea nu este, avem suficiente date... este mai mult care este încadrarea problemei", spune Matthew Johnson-Roberson, cercetător la Universitatea Carnegie Mellon din Pittsburgh.
Johnson-Roberson spune că, pentru toate abilitățile incredibile afișate de chatboți, sarcina pe care sunt rugați să o facă este relativ simplă - să se uite la ceea ce tastează un utilizator uman și apoi să încercați să preziceți următoarele cuvinte pe care utilizatorul dorește să le vadă. Roboții vor trebui să facă mult mai mult decât să compună o propoziție.
"Predicția celui mai bun cuvânt următor funcționează foarte bine și este o problemă foarte simplă, deoarece doar prezici următorul cuvânt", spune el. Deplasarea prin spațiu și timp pentru a executa o sarcină este un set mult mai mare de variabile pe care o rețea neuronală să încerce să le proceseze.
"Nu este clar în acest moment că pot lua 20 de ore de filmări Go-Pro și pot produce ceva sensibil cu privire la modul în care un robot se mișcă în lume", spune el.
Johnson-Roberson spune că el crede că trebuie făcute cercetări mai fundamentale cu privire la modul în care rețelele neuronale pot procesa mai bine spațiul și timpul. Și avertizează că domeniul trebuie să fie atent, deoarece robotica a fost arsă înainte – de cursa pentru a construi mașini cu conducere autonomă.
"Atât de mult capital s-a repezit atât de repede", spune el. "I-a stimulat pe oameni să facă promisiuni într-un interval de timp pe care nu le puteau îndeplini." O mare parte din capital a părăsit apoi domeniul și există încă probleme fundamentale pentru mașinile fără șofer care rămân nerezolvate.
Totuși, chiar și scepticii cred că robotica va fi schimbată pentru totdeauna de inteligența artificială. Goldberg a co-fondat o companie de sortare a coletelor numită Ambi Robotics, care a lansat un nou sistem bazat pe inteligență artificială, cunoscut sub numele de PRIME-1, la începutul acestui an. Utilizează inteligența artificială pentru a identifica cele mai bune puncte pentru ca un braț robotic să ridice un pachet. Odată ce are punctul de ridicare stabilit de AI, brațul, care este controlat de o programare mai convențională, face prinderea.
Noul sistem a redus dramatic numărul de ori în care pachetele sunt scăpate, spune el. Dar adaugă cu un râs: „dacă pui chestia asta în fața unei grămezi de haine, nu va ști ce să facă cu asta”.
Înapoi la Stanford, Chelsea Finn spune că este de acord că așteptările trebuie ținute sub control.
"Cred că mai este un drum lung de parcurs pentru tehnologie", spune ea. Nici nu se așteaptă ca roboții universali să înlocuiască complet munca umană – în special pentru sarcini complexe.
Dar într-o lume cu populații îmbătrânite și cu penurie de forță de muncă preconizată, ea crede că roboții bazați pe inteligență artificială ar putea reduce o parte din decalaj.
"Îmi imaginez că acesta va fi cu adevărat ceva care va spori oamenii și îi va ajuta", spune ea.