3 min read

NVIDIA apre lo stack di IA fisica agli agenti con nuove skill per robotica, veicoli autonomi e IA di visione

NVIDIA Opens Physical AI Stack to Agents With New Skills for Robotics, AVs, and Vision AI

NVIDIA ha rilasciato un'importante raccolta open source di skill e strumenti per agenti di IA fisica al GTC Taipei il 31 maggio 2026, consentendo agli agenti di IA di orchestrare direttamente i flussi di lavoro di sviluppo nei settori di robotica, veicoli autonomi, IA di visione e gemelli digitali industriali.

Di cosa si tratta

Le nuove skill vengono distribuite come parte dell'NVIDIA Agent Toolkit e incapsulano le librerie esistenti di NVIDIA — Cosmos, Omniverse, Isaac, Metropolis, Alpamayo e Jetson — in strumenti richiamabili dagli agenti. Invece di concatenare manualmente i passaggi di generazione dei dati, simulazione, addestramento, valutazione e impiego, gli agenti di codifica possono ora eseguire queste pipeline end-to-end seguendo istruzioni ripetibili e ottimizzate.

Le skill coprono cinque ambiti:

  • Robotica ed edge AI: generazione di dati di percezione e mobilità, addestramento alla navigazione, aggiornamenti Isaac GR00T e ottimizzazione dell'impiego su Jetson
  • Veicoli autonomi: ricostruzione dei dati delle flotte in simulazione, generazione di scenari fotorealistici e reinforcement learning a ciclo chiuso tramite Alpamayo
  • IA di visione: generazione di dati sintetici, fine-tuning dei modelli, etichettatura automatizzata e analisi video dal vivo tramite Metropolis
  • IA industriale: conversione da CAD a gemello digitale e ottimizzazione delle scene OpenUSD tramite Omniverse
  • Sanità: creazione di gemelli digitali ospedalieri e test di policy dalla simulazione alla realtà

Gli agenti girano su Jetson all'edge. La governance di sicurezza e privacy è gestita tramite il blueprint NVIDIA NemoClaw e il runtime NVIDIA OpenShell.

Cosa c'è di nuovo rispetto al passato

Le singole librerie di NVIDIA — Isaac, Omniverse, Cosmos — esistevano già. Il cambiamento qui consiste nell'incapsularle come strumenti richiamabili dagli agenti anziché come API rivolte agli sviluppatori. Secondo Rev Lebaredian, VP per la simulazione di IA fisica di NVIDIA, i nuovi flussi di lavoro end-to-end Isaac GR00T possono ora essere configurati in ore anziché settimane. Il modello Cosmos 3, annunciato insieme al toolkit, aggiunge un'architettura mixture-of-transformers che combina ragionamento di visione e generazione multimodale — testo, immagini, video, suono ambientale e azioni — in un unico modello aperto.

Adozione e limiti

Secondo NVIDIA, 1X Technologies, Agile Robots, Agility, FieldAI, Hexagon Robotics, NEURA Robotics, Skild AI e Universal Robots utilizzano già lo stack pronto per gli agenti. Tra gli utenti sono citati anche partner industriali come Foxconn, Pegatron, Siemens, TSMC, Dassault Systèmes e Cadence.

Le affermazioni di NVIDIA sulle prestazioni — classifiche nei benchmark per Cosmos 3, specifiche cifre sulla velocità di inferenza e numeri di miglioramento dell'uptime — sono dichiarate dall'azienda ma non verificate in modo indipendente nelle fonti disponibili. Il toolkit è open source e disponibile su github.com/NVIDIA/skills, anche se l'ampiezza della documentazione e la facilità di integrazione da parte di terzi non sono dettagliate nell'annuncio.

Se il livello di orchestrazione degli agenti mantiene la promessa di configurazione in ore anziché settimane, attacca direttamente il collo di bottiglia dell'integrazione software che ha rallentato l'impiego dell'IA fisica, un problema ben documentato in tutto il settore. Ciò abbasserebbe la soglia per i team di robotica più piccoli che non hanno la profondità ingegneristica per collegare manualmente le pipeline di simulazione, addestramento e impiego.