Bolt42

O CEO da NVIDIA, Jensen Huang, anunciou uma série de avanços revolucionários nas capacidades de computação em IA na keynote do GTC de março de 2025, descrevendo o que chamou de um “ponto de inflexão de $1 trilhão em computação.” A apresentação revelou a prontidão para produção da arquitetura de GPU Blackwell, um roteiro de vários anos para futuras arquiteturas, grandes avanços em redes de IA, novas soluções de IA para empresas e desenvolvimentos significativos em robótica e IA física.

A “Economia dos Tokens” e Fábricas de IA

Central à visão de Huang está o conceito de “tokens” como os blocos de construção fundamentais da IA e o surgimento de “fábricas de IA” como data centers especializados projetados para computação generativa.

“É assim que a inteligência é feita, uma nova espécie de fábrica geradora de tokens, os blocos de construção da IA. Os tokens abriram uma nova fronteira,” afirmou Huang ao público. Ele enfatizou que os tokens podem “transformar imagens em dados científicos que mapeiam atmosferas alienígenas,” “decifrar as leis da física” e “ver doenças antes que se manifestem.”

Essa visão representa uma mudança da “computação de recuperação” tradicional para a “computação generativa,” onde a IA compreende o contexto e gera respostas em vez de apenas recuperar dados pré-armazenados. De acordo com Huang, essa transição requer um novo tipo de arquitetura de data center onde “o computador se tornou um gerador de tokens, não uma recuperação de arquivos.”

Arquitetura Blackwell Oferece Ganhhos de Performance Massivos

A arquitetura de GPU Blackwell da NVIDIA, agora em “produção total,” entrega o que a empresa afirma ser “40x o desempenho do Hopper” para modelos de raciocínio sob condições de potência idênticas. A arquitetura inclui suporte para precisão FP4, resultando em melhorias significativas na eficiência energética.

“Power ISO, Blackwell é 25 vezes,” afirmou Huang, destacando os ganhos de eficiência dramáticos da nova plataforma.

A arquitetura Blackwell também suporta expansão extrema por meio de tecnologias como NVLink 72, permitindo a criação de sistemas de GPU unificados e massivos. Huang previu que o desempenho do Blackwell tornará as GPUs de gerações anteriores significativamente menos atrativas para cargas de trabalho de IA exigentes.

(Fonte: NVIDIA)

Roteiro Previsível para Infraestrutura de IA

A NVIDIA delineou uma cadência anual regular para suas inovações em infraestrutura de IA, permitindo que os clientes planejem seus investimentos com maior certeza:

  • Blackwell Ultra (Segunda metade de 2025): Um upgrade para a plataforma Blackwell com aumento de FLOPs, memória e largura de banda.
  • Vera Rubin (Segunda metade de 2026): Uma nova arquitetura com uma CPU com desempenho dobrado, uma nova GPU e tecnologias de memória e NVLink de próxima geração.
  • Rubin Ultra (Segunda metade de 2027): Uma arquitetura de escalabilidade extrema visando 15 exaflops de computação por rack.

Democratizando a IA: Das Redes aos Modelos

Para concretizar a visão de adoção ampla de IA, a NVIDIA anunciou soluções abrangentes que abrangem redes, hardware e software. No nível da infraestrutura, a empresa está abordando o desafio de conectar centenas de milhares ou até milhões de GPUs em fábricas de IA por meio de investimentos significativos em tecnologia de fotônica de silício. Seu primeiro sistema de fotônica de silício co-embalado (CPO), um CPO de 1,6 terabits por segundo baseado na tecnologia de modulação de ressonador de anel micro (MRM), promete economias de potência substanciais e maior densidade em comparação com transceptores tradicionais, permitindo conexões mais eficientes entre um número massivo de GPUs em diferentes locais.

Enquanto constrói a base para fábricas de IA em larga escala, a NVIDIA está simultaneamente trazendo poder de computação em IA para indivíduos e pequenas equipes. A empresa introduziu uma nova linha de supercomputadores pessoais de IA DGX alimentados pela plataforma Grace Blackwell, destinadas a capacitar desenvolvedores de IA, pesquisadores e cientistas de dados. A linha inclui o DGX Spark, uma plataforma de desenvolvimento compacta, e o DGX Station, uma estação de trabalho desktop de alto desempenho com refrigeração líquida e impressionantes 20 petaflops de computação.

NVIDIA DGX Spark (Fonte: NVIDIA)

Complementando esses avanços em hardware, a NVIDIA anunciou a família de modelos abertos Llama Nemotron com capacidades de raciocínio, projetados para estarem prontos para o mercado, a fim de construir agentes de IA avançados. Esses modelos estão integrados ao NIM da NVIDIA (NVIDIA Inference Microservices), permitindo que os desenvolvedores os implantem em várias plataformas, desde estações de trabalho locais até a nuvem. A abordagem representa uma solução de pilha completa para a adoção de IA nas empresas.

Huang enfatizou que essas iniciativas estão sendo aprimoradas por meio de colaborações extensivas com grandes empresas de múltiplos setores que estão integrando os modelos da NVIDIA, NIM e bibliotecas em suas estratégias de IA. Essa abordagem ecossistêmica visa acelerar a adoção enquanto oferece flexibilidade para diferentes necessidades e casos de uso das empresas.

IA Física e Robótica: Uma Oportunidade de $50 Trilhões

A NVIDIA vê a IA física e a robótica como uma “oportunidade de $50 trilhões,” de acordo com Huang. A empresa anunciou o NVIDIA Isaac GR00T N1 de código aberto, descrito como um “modelo fundamental generalista para robôs humanoides.”

Atualizações significativas aos modelos de fundação do mundo da NVIDIA Cosmos fornecem controle sem precedentes sobre a geração de dados sintéticos para treinamento de robôs usando o NVIDIA Omniverse. Como Huang explicou: “Usar o Omniverse para condicionar o Cosmos, e o Cosmos para gerar um número infinito de ambientes, nos permite criar dados que são fundamentados, controlados por nós e, ao mesmo tempo, sistematicamente infinitos.”

A empresa também revelou um novo motor de física de código aberto chamado “Newton”, desenvolvido em colaboração com o Google DeepMind e a Disney Research. O motor é projetado para simulação de robótica de alta fidelidade, incluindo corpos rígidos e macios, feedback tátil e aceleração por GPU.

Isaac GR00T N1 (Fonte: NVIDIA)

IA Agente e Transformação da Indústria

Huang definiu a “IA agente” como IA com “agência” que pode “perceber e entender o contexto,” “raciocinar” e “planejar e agir,” mesmo utilizando ferramentas e aprendendo a partir de informações multimodais.

“IA agente basicamente significa que você tem uma IA que tem agência. Ela pode perceber e entender o contexto da circunstância. Pode raciocinar, muito importante, pode raciocinar sobre como responder ou como resolver um problema, e pode planejar e agir. Ela pode usar ferramentas,” explicou Huang.

Essa capacidade está impulsionando um aumento nas demandas computacionais: “A quantidade de requisitos de computação, a lei de escalonamento da IA é mais resiliente e, de fato, hiperacelerada. A quantidade de computação que precisamos neste ponto, como resultado da IA agente, como resultado do raciocínio, é facilmente cem vezes mais do que pensávamos que precisaríamos no ano passado,” acrescentou.

A Conclusão

A keynote de Jensen Huang no GTC 2025 apresentou uma visão abrangente de um futuro movido pela IA caracterizado por agentes inteligentes, robôs autônomos e fábricas de IA projetadas para propósitos específicos. Os anúncios da NVIDIA em arquitetura de hardware, redes, software e modelos de código aberto sinalizam a determinação da empresa em impulsionar e acelerar a próxima era da computação.

À medida que a computação continua sua mudança de modelos baseados em recuperação para modelos generativos, o foco da NVIDIA em tokens como a moeda central da IA e em capacidades de escalonamento em plataformas de nuvem, empresas e robótica oferece um roteiro para o futuro da tecnologia, com implicações abrangentes para indústrias em todo o mundo.


    14 + 7 =

    Bolt42