- Alen Liverić
Tvrtka za robotiku pod nazivom Figure predstavila je humanoidnog robota koji integrira OpenAI-jevu naprednu jezičnu tehnologiju, omogućujući mu da se uključi u razgovore u stvarnom vremenu i obavlja zadatke u isto vrijeme.
Descript izvještava da je tvrtka za robotiku Figure predstavila svoju najnoviju kreaciju – humanoidnog robota za razgovor s najsuvremenijom tehnologijom umjetne inteligencije OpenAI. Robot ima sposobnost trenutnog razumijevanja i reagiranja na ljudske interakcije, zahvaljujući integraciji moćnih OpenAI jezičnih modela.
Nedavno partnerstvo tvrtke s OpenAI-jem donijelo je visoku razinu vizualne i jezične inteligencije svojim robotima, omogućujući “brze, spretne radnje robota niske razine”. Ova sinergija između napredne umjetne inteligencije i robotike rezultirala je robotom koji ne samo da može razgovarati s ljudima, već također može glatko obavljati zadatke i obavljati više zadataka istovremeno.
Mediji su ranije izvijestili da je Figure stekao podršku visokog profila, uključujući ulaganja Jeffa Bezosa i Nvidije.
U video demonstraciji koju je objavio Figure, robot Figure 01 može se vidjeti u interakciji s višim inženjerom umjetne inteligencije njegovog tvorca, Coreyjem Lynchom, koji vodi robota kroz niz zadataka i pitanja u simuliranom kuhinjskom okruženju. Robot bez napora prepoznaje predmete kao što su jabuka, posuđe i šalice, a kada se od njega zatraži nešto za jelo, odmah nudi jabuku, pokazujući svoju sposobnost razumijevanja i izvršavanja naredbi.
We are now having full conversations with Figure 01, thanks to our partnership with OpenAI.
— Corey Lynch (@coreylynch) March 13, 2024
Our robot can:
- describe its visual experience
- plan future actions
- reflect on its memory
- explain its reasoning verbally
Technical deep-dive 🧵:pic.twitter.com/6QRzfkbxZY
Štoviše, ovaj robot može skupljati smeće u košaru dok istovremeno sudjeluje u razgovoru, ističući svoje mogućnosti multitaskinga. Prema Lynchu, robot može opisati svoja vizualna iskustva, planirati buduće radnje, razmisliti o svom sjećanju i verbalno objasniti svoje misli – pothvat koji bi bio nezamisliv prije samo nekoliko godina.
Ključ mogućnosti razgovora na slici 01 leži u integraciji OpenAI multimodalnih AI modela. Ovi modeli mogu razumjeti i generirati različite vrste podataka, kao što su tekst i slike, omogućujući robotu da obradi vizualni i slušni unos i reagira u skladu s tim. Lynch je objasnio da model obrađuje cjelokupnu povijest razgovora, uključujući slike iz prošlosti, kako bi generirao lingvističke odgovore, koji se zatim vraćaju čovjeku putem pretvaranja teksta u govor.
Debi robota izazvao je veliku reakciju na društvenim mrežama, mnogi su bili impresionirani robotovim sposobnostima, a neki su čak povlačili usporedbe sa scenarijima znanstvene fantastike. Međutim, za programere i istraživače umjetne inteligencije, Lynch je pružio vrijedne tehničke uvide, navodeći da su sva ponašanja vođena politikama neuronske mreže vizuomotornog transformatora, preslikavajući piksele izravno na akcije.



