Nonostante i rapidi progressi nel campo della robotica e dell’intelligenza artificiale, i robot umanoidi veramente versatili rimangono in gran parte confinati nei laboratori di ricerca e in contesti industriali specializzati. La visione di androidi che si integrano perfettamente nella vita di tutti i giorni – versando bevande, svolgendo le faccende domestiche o anche semplicemente camminando per strada senza cadere – rimane ostinatamente fuori portata. Il problema principale non è costruire le macchine stesse; li sta facendo funzionare in modo affidabile nel mondo reale disordinato e imprevedibile.
Il divario della realtà: oltre gli stabilimenti produttivi
Milioni di robot svolgono già compiti ripetitivi nelle fabbriche, aspirano i pavimenti e falciano i prati. Ma questi sono strumenti specializzati. Il tipo di robot umanoidi generici visti nella fantascienza – come C-3PO o Dolores Abernathy – richiedono un livello molto più profondo di adattabilità. Un robot può eseguire in modo impeccabile una routine di danza su una superficie piana, ma introduce marciapiedi irregolari, scale scivolose o comportamenti umani imprevedibili e il sistema si guasta. Immagina di navigare in una camera da letto disordinata al buio mentre porti una ciotola piena di zuppa: ogni passo richiede una ricalibrazione e un giudizio costanti.
L’intelligenza artificiale non è la risposta…per ora
I modelli linguistici di grandi dimensioni (LLM) come ChatGPT non risolvono questo problema. Eccellono nell’elaborazione delle informazioni ma mancano di conoscenza incorporata. Gli LLM possono descrivere perfettamente la navigazione, ma non hanno mai sentito il vento né maneggiato una vela. Come sottolinea Yann LeCun, capo scienziato dell’intelligenza artificiale di Meta, un bambino di quattro anni ha già elaborato 50 volte più dati visivi di quelli su cui sono addestrati i più grandi LLM. I bambini imparano da anni di esperienza fisica; gli attuali set di dati dell’intelligenza artificiale sono relativamente piccoli e si concentrano sul tipo sbagliato di informazioni. Milioni di poesie non insegneranno a un robot come piegare il bucato.
Due approcci, entrambi imperfetti
Gli esperti di robotica stanno perseguendo due strategie principali per colmare questo divario. Il primo è una dimostrazione, in cui gli esseri umani teleoperano i robot (spesso tramite la realtà virtuale) per creare set di dati di addestramento. Il secondo è la simulazione, che consente ai sistemi di intelligenza artificiale di svolgere attività migliaia di volte più velocemente degli esseri umani. Tuttavia, entrambi i metodi colpiscono il “gap di realtà”. Un compito simulato può fallire in modo spettacolare nel mondo reale a causa di innumerevoli dettagli trascurati: attrito, superfici irregolari, illuminazione imprevedibile.
La complessità sconosciuta delle attività quotidiane
Anche i compiti apparentemente semplici sono straordinariamente difficili per i robot. Considera l’idea di frugare in una borsa da palestra affollata per trovare una maglietta specifica. Una mano umana rileva istantaneamente texture, forme e resistenza, permettendoci di identificare gli oggetti al tatto senza estrarre tutto. Questo è il motivo per cui i primi World Humanoid Robot Games, con calcio e boxe robotici, hanno mancato il bersaglio. Ciò che le persone realmente vogliono non sono i robot atletici; vogliono macchine in grado di piegare il bucato, pulire gli escrementi dei cani o pulire il burro di arachidi dalle proprie mani.
Il parallelo dell’auto a guida autonoma
La sfida è simile a quella affrontata dalle auto a guida autonoma. Tesla e altre aziende raccolgono enormi quantità di dati di guida per addestrare la propria intelligenza artificiale. Tuttavia, le case, i cantieri e gli spazi esterni sono molto più caotici delle autostrade, rendendo il problema esponenzialmente più difficile.
Il futuro rimane incerto
I robot attuali sono progettati per ambienti controllati – magazzini, ospedali o marciapiedi chiaramente definiti – e svolgono un unico lavoro specifico. Digit di Agility Robotics trasporta borse da magazzino; I robot di Figure AI lavorano sulle catene di montaggio. Queste macchine sono utili, ma lungi dall’essere aiutanti generici. Gli esperti non sono d’accordo su quando (o se) questo divario si colmerà. Il CEO di Nvidia Jensen Huang prevede una svolta “tra pochi anni”, mentre l’esperto di robotica Rodney Brooks avverte che le implementazioni redditizie sono “a più di dieci anni di distanza”, citando preoccupazioni per la sicurezza. Il suo consiglio? Stare ad almeno tre metri di distanza dai robot ambulanti a grandezza naturale.
Alla fine, il sogno di robot umanoidi onnipresenti rimane proprio questo: un sogno. I limiti fondamentali della tecnologia attuale suggeriscono che la vera versatilità è ancora un obiettivo lontano, che richiede scoperte sia nell’hardware che nell’intelligenza artificiale che non sono ancora all’orizzonte.
