Wykorzystując wyłącznie sztuczną inteligencję o otwartym kodzie źródłowym, badacze zbudowali komercyjnego robota, który miał znajdować i przenosić obiekty po pomieszczeniu, w którym nigdy wcześniej nie był. Robot nie jest doskonały, ale sugeruje, że być może nie jesteśmy tak daleko od dzielenia się domem z robotami domowymi, jak wcześniej sądzili eksperci.
„Po prostu absolutnie niemożliwe”: Filmy demonstracyjne robotów Sprzątanie kuchni, Robienie przekąsekI Wykonywanie innych prac domowych Być może chciałbyś, żeby dni ładowania zmywarki były policzone, ale eksperci AI przewidują, że wciąż jesteśmy tacy sami Za dekadę Od przekazania części naszej rutynowej pracy robotom.
„W społeczeństwie panuje bardzo wszechobecne uczucie [robotics] „Domy są trudne, roboty są trudne, a łączenie domów i robotów jest absolutnie niemożliwe” – powiedział Mahi Shafiullah, doktorant na NYU Courant. Powiedzieć Przegląd technologii MIT.
Otwarte oprogramowanie, gotowe do użycia: Główną przeszkodą w rewolucji robotyki domowej jest fakt zbudowania robota, który może w nim działać Ktokolwiek Dom jest znacznie trudniejszy niż nauczenie człowieka pracy w kontrolowanym środowisku laboratoryjnym.
Nowe badanie – współkierowane przez Shafiullaha i z udziałem naukowców z New York University i organizacji Meta zajmującej się sztuczną inteligencją – sugeruje, że możemy być bliżej robotów domowych, niż nam się wydaje.
Wykorzystując wyłącznie oprogramowanie typu open source, zmodyfikowali dostępnego na rynku robota tak, aby na polecenie mógł przesuwać obiekty po pomieszczeniu, w którym nigdy wcześniej się nie znajdował. Nazywają system „OK-Robot” i pokazują szczegóły pracy w pliku papier Udostępnione na serwerze preprintów arXiv.
„Po prostu powiedz robotowi, co ma wybrać i gdzie to upuścić, w języku naturalnym, a on to zrobi”. ćwierkanie Lirel Pinto, która wspólnie z Shafiullahem kierowała badaniem.
Jak to działa: the Robot będący sercem systemu OK-Robot nazywa się Rozciąganie (Możesz go kupić za jedyne 19 950 USD plus koszty wysyłki i podatki.) Przedłużenie ma podstawę na kółkach, pionowy słup i ramię robota, które może przesuwać się w górę i w dół słupa. Na końcu ramienia znajduje się chwytak, który pozwala robotowi chwytać przedmioty.
Aby zamienić robota w coś, z czym ludzie mogą rozmawiać, zespół wyposażył go w modele języka wizyjnego (VLM) – sztuczną inteligencję przeszkoloną do rozumienia zarówno obrazów, jak i słów – a także wstępnie wytrenowane modele nawigacji i chwytania.
Następnie utworzyli film 3D przedstawiający pomieszczenie za pomocą aplikacji Record3D na iPhone'a i udostępnili go robotowi, co zajęło około sześciu minut. Następnie mogą wydać robotowi polecenie tekstowe, aby przesunął obiekt w pomieszczeniu w nowe miejsce, a robot zlokalizuje obiekt i przeniesie go.
Przetestowali OK-Robota w 10 pokojach. W każdym pokoju wybierają od 10 do 20 obiektów, które można umieścić w uścisku robota i proszą go o przesunięcie ich (jeden po drugim) do innej części pokoju („przesuń puszkę z napojem do pudełka”, „przesuń tacos „od biurka do stołu” itp.).
Ogólnie rzecz biorąc, robot osiągnął wskaźnik sukcesu w wykonywaniu zadań na poziomie 58,5%. Jednak w mniej zatłoczonych pokojach wskaźnik sukcesu był znacznie wyższy: 82,4%.
Nie mogę się doczekać: Choć OK-Robot potrafi tylko jedno (i nie zawsze robi to dobrze), to fakt, że bazuje na gotowych modelach i nie wymaga żadnego specjalnego przeszkolenia do pracy w nowym środowisku — wystarczy wideo pokoju — jest całkiem fajnie.
To będzie kolejny krok dla zespołu Otwórz kod źródłowy ich kodu Aby inni mogli kontynuować to, co zaczęli, i być może pomóc robotom domowym wykonać prace szybciej, niż się spodziewano.
„Myślę, że kiedy ludzie zaczną wierzyć w możliwość wykorzystania domowych robotów, rozpocznie się wiele pracy w tym obszarze” – powiedział Shafiullah.
Ten stan Oryginalnie opublikowane przez naszą siostrzaną witrynę Freethink.
„Zła entuzjasta podróży. Irytująco skromny ćpun internetu. Nieprzepraszający alkoholiczek”.