Navzdory rychlému pokroku v robotice a umělé inteligenci jsou skutečně všestranní humanoidní roboti stále z velké části uzavřeni ve výzkumných laboratořích a specializovaných průmyslových zařízeních. Vize androidů hladce integrovaných do každodenního života – nalévání nápojů, domácí práce nebo prostě chození po ulici, aniž by upadli – zůstává tvrdošíjně nepolapitelná. Hlavní problém není ve vytváření samotných strojů; jde o to, aby fungovali spolehlivě v chaotickém a nepředvídatelném reálném světě.

Propast mezi realitou a podlahou továrny

Miliony robotů již provádějí opakující se úkoly v továrnách, vysávají podlahy a sekají trávníky. Ale to jsou specializované nástroje. Robot tak všestranný jako sci-fi – jako C-3PO nebo Dolores Abernathy – vyžaduje mnohem hlubší úroveň přizpůsobivosti. Robot dokáže bezchybně předvést taneční rutinu na rovném povrchu, ale přidá k tomu nerovné chodníky, kluzké schody nebo nepředvídatelné lidské chování a systém se zhroutí. Představte si, že se ve tmě pohybujete v přeplněné ložnici a držíte plnou misku polévky: každý krok vyžaduje neustálou rekalibraci a hodnocení situace.

Umělá inteligence zatím není řešení…

Velké jazykové modely (LLM), jako je ChatGPT, tento problém neřeší. Jsou vynikajícími zpracovateli informací, ale postrádají tělesné znalosti. LLM dokážou dokonale popsat plachtění, ale nikdy necítily vítr ani nedržely v rukou plachtu. Jak poznamenává hlavní vědec společnosti Meta Yann LeCun v oblasti AI, čtyřleté dítě již zpracovalo 50krát více vizuálních dat než největší LLM, na kterých je školeno. Děti se učí letitými fyzickými zkušenostmi; stávající datové soubory umělé inteligence jsou při srovnání zakrnělé a zaměřují se na nesprávný druh informací. Miliony básní nenaučí robota skládat prádlo.

Dva přístupy, oba nedokonalé

Robotici sledují dvě hlavní strategie, jak tuto propast překlenout. První je ukázka, ve které lidé vzdáleně ovládají roboty (často prostřednictvím virtuální reality), aby vytvořili tréninkové datové sady. Druhým je simulace, která umožňuje systémům AI procvičovat úkoly tisíckrát rychleji než lidé. Obě metody však narážejí na „mezera mezi realitou a simulací“. Úkoly simulované ve virtuálním prostředí mohou v reálném světě selhat kvůli nespočtu chybějících detailů: tření, nerovné povrchy, nepředvídatelné osvětlení.

Neočekávaná složitost domácích úkolů

I zdánlivě jednoduché úkoly jsou pro roboty neuvěřitelně obtížné. Představte si, že se díváte do přeplněné tělocvičny a hledáte konkrétní tričko. Lidská ruka okamžitě vnímá textury, tvary a odpor, což nám umožňuje identifikovat předměty dotykem, aniž bychom museli vše vytahovat. Proto první Světové hry humanoidních robotů, kterých se účastnili robotičtí fotbalisté a boxeři, nebyly úspěšné. Lidé nechtějí sportovní roboty; chtějí stroje, které dokážou skládat prádlo, sbírat psí hovínka nebo otřít arašídové máslo z rukou.

Paralely se samořídícími auty

Výzva je podobná té, které čelí samořídící auta. Tesla a další společnosti shromažďují obrovské množství dat o řízení, aby trénovaly své systémy AI. Domy, staveniště a otevřená prostranství jsou však mnohem chaotičtější než dálnice, což tento problém exponenciálně ztěžuje.

Budoucnost zůstává nejistá

Dnešní roboti jsou navrženi pro kontrolovaná prostředí – sklady, nemocnice nebo dobře definované chodníky – a vykonávají jednu konkrétní práci. Digit společnosti Agility Robotics přesouvá skladové palety; Roboti Figure AI pracují na montážních linkách. Tyto stroje jsou užitečné, ale zdaleka ne univerzálními pomocníky. Odborníci se neshodnou na tom, kdy (nebo zda vůbec) se tato mezera uzavře. Generální ředitel společnosti Nvidia Jensen Huang předpovídá, že k průlomu dojde „několik let“, zatímco robotik Rodney Brooks varuje, že zisková nasazení jsou „více než deset let daleko“, s odkazem na bezpečnostní obavy. Jeho rada? Držte se alespoň tři metry od chodících robotů v plné velikosti.

Nakonec sen o všudypřítomných humanoidních robotech zůstává jen snem. Zásadní omezení stávajících technologií znamenají, že skutečná univerzálnost zůstává vzdáleným cílem a vyžaduje průlomy v hardwaru a AI, které ještě nejsou na obzoru.