Bolt42

Participe de nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de ponta. Saiba mais


A Nvidia anunciou um esboço do Isaac GR00T para acelerar o desenvolvimento de robótica humanoide.

No keynote da CES 2025 do CEO da Nvidia, Jensen Huang, ele afirmou que os fluxos de trabalho do Isaac GR00T para dados sintéticos e os modelos de fundação do mundo da Nvidia Cosmos irão impulsionar o desenvolvimento de robôs humanoides em geral.

Robôs em movimento

Nas próximas duas décadas, espera-se que o mercado de robôs humanoides alcance $38 bilhões. Para atender a essa demanda significativa, especialmente nos setores industrial e de manufatura, a Nvidia está lançando uma coleção de modelos de fundação de robôs, pipelines de dados e estruturas de simulação para acelerar o desenvolvimento de robôs humanoides de próxima geração.

O esboço do Nvidia Isaac GR00T para geração de movimento sintético ajuda os desenvolvedores a gerar conjuntos de dados de movimento sintético exponencialmente grandes para treinar seus robôs humanoides usando aprendizado por imitação.

O aprendizado por imitação — um subconjunto do aprendizado de robôs — permite que os humanoides adquiram novas habilidades observando e imitando demonstrações de especialistas humanos. Coletar esses conjuntos de dados extensos e de alta qualidade no mundo real é tedioso, demorado e frequentemente proibitivamente caro.

A implementação do esboço do Isaac GR00T para geração de movimento sintético permite que os desenvolvedores gerem facilmente conjuntos de dados sintéticos exponencialmente grandes a partir de apenas um pequeno número de demonstrações humanas.

Começando com o fluxo de trabalho GR00T-Teleop, os usuários podem utilizar o Apple Vision Pro para capturar ações humanas em um gêmeo digital. Essas ações humanas são imitadas por um robô em simulação e registradas para uso como verdade de base.

O fluxo de trabalho GR00T-Mimic então multiplica a demonstração humana capturada em um conjunto de dados sintético de movimento maior. Por fim, o fluxo de trabalho GR00T-Gen, construído nas plataformas Nvidia Omniverse e Nvidia Cosmos, expande exponencialmente esse conjunto de dados através da randomização de domínio e do upscaling 3D.

O conjunto de dados pode então ser usado como entrada para a política do robô, que ensina os robôs como se mover e interagir com seu ambiente de forma eficaz e segura no Nvidia Isaac Lab, uma estrutura modular e de código aberto para aprendizado de robôs.

Modelos de fundação do mundo diminuem a lacuna sim-para-real

Qual deles não é o robô?

Também na CES, a Nvidia anunciou o Cosmos, uma plataforma que apresenta uma família de modelos de fundação de mundo pré-treinados, projetados para gerar vídeos e estados do mundo informados por física para o desenvolvimento de IA física. Inclui modelos autorregressivos e de difusão em vários tamanhos e formatos de dados de entrada. Os modelos foram treinados em 18 quadrilhões de tokens, incluindo 2 milhões de horas de direção autônoma, robótica, filmagens de drones e dados sintéticos.

Além de ajudar a gerar grandes conjuntos de dados, o Cosmos pode reduzir a lacuna sim-para-real ampliando imagens de 3D para real. Combinar o Omniverse — uma plataforma de desenvolvedor de interfaces de programação de aplicativos e microsserviços para construção de aplicações e serviços 3D — com o Cosmos é crítico, pois ajuda a minimizar as alucinações potenciais comumente associadas a modelos de mundo, fornecendo salvaguardas cruciais através de suas simulações fisicamente precisas e altamente controláveis.

Um ecossistema em expansão

Nvidia GR00T gera dados sintéticos para robôs.

Coletivamente, Nvidia Isaac GR00T, Omniverse e Cosmos estão ajudando a inovação em IA física e humanoides a dar um grande salto em frente. Grandes empresas de robótica, como Boston Dynamics e Figure, começaram a adotar e demonstrar resultados com o Isaac GR00T.

Fabricantes de software, hardware e robôs humanoides podem se inscrever para acesso antecipado ao programa de desenvolvimento de robôs humanoides da Nvidia.





    8 + dois =




    Bolt42