Bolt42

Participe das nossas newsletters diárias e semanais para receber as últimas atualizações e conteúdo exclusivo sobre a cobertura líder da indústria em IA. Saiba Mais


SAN JOSE, Calif. — O CEO da Nvidia, Jensen Huang, subiu ao palco no SAP Center na manhã de terça-feira, com seu inseparável casaco de couro e sem teleprompter, para apresentar uma das palestras mais aguardadas da indústria tecnológica. A GPU Technology Conference (GTC) 2025, descrita por Huang como o “Super Bowl da IA,” acontece em um momento crítico tanto para a Nvidia quanto para o setor de inteligência artificial como um todo.

“Que ano incrível, e temos muitas coisas incríveis para discutir,” disse Huang ao público lotado, durante a sua apresentação, que cresceu exponencialmente à medida que a IA se transformou de uma tecnologia de nicho em uma força fundamental que está remodelando indústrias inteiras. As expectativas estavam particularmente elevadas este ano após a turbulência no mercado provocada pela apresentação do altamente eficiente modelo de raciocínio R1 da startup chinesa DeepSeek, que fez as ações da Nvidia despencarem mais cedo este ano por conta de preocupações sobre uma demanda reduzida por suas caras GPUs.

Diante desse cenário, Huang apresentou uma visão abrangente do futuro da Nvidia, enfatizando um claro roteiro para computação em data centers, avanços nas capacidades de raciocínio em IA e ousadas incursões na robótica e veículos autônomos. A apresentação pintou um quadro de uma empresa que busca manter sua posição dominante na infraestrutura de IA enquanto se expande para novos territórios onde sua tecnologia pode agregar valor. Durante a apresentação, as ações da Nvidia caíram, fechando com uma queda de mais de 3% no dia, sugerindo que os investidores esperavam anúncios ainda mais dramáticos.

No entanto, se a mensagem de Huang foi clara, foi esta: a IA não está desacelerando, e nem a Nvidia. Desde chips inovadores até um impulso na IA física, aqui estão as cinco principais conclusões do GTC 2025.

A plataforma Blackwell aumenta a produção com um ganho de 40x de desempenho em relação ao Hopper

O destaque da estratégia de computação em IA da Nvidia, a plataforma Blackwell, está agora em “produção total,” segundo Huang, que enfatizou que “a demanda dos clientes é incrível.” Este é um marco significativo após o que Huang descreveu anteriormente como um “hiccup” na produção inicial.

Huang fez uma comparação impressionante entre a Blackwell e seu predecessor, Hopper: “Blackwell NVLink 72 com Dynamo tem 40 vezes o desempenho da fábrica de IA do Hopper.” Esse salto de desempenho é particularmente crucial para cargas de trabalho de inferência, que Huang posicionou como “uma das mais importantes nos próximos dez anos à medida que escalamos a IA.”

Os aumentos de desempenho ocorrem em um momento crítico para a indústria, já que modelos de IA de raciocínio como o R1 da DeepSeek exigem substancialmente mais computação do que modelos grandes tradicionais. Huang ilustrou isso com uma demonstração comparando a abordagem de um LLM tradicional para a organização de assentos em um casamento (439 tokens, mas errado) versus a abordagem de um modelo de raciocínio (quase 9.000 tokens, mas correto).

“A quantidade de computação que precisamos realizar em IA é muito maior em decorrência do raciocínio em IA e do treinamento de sistemas de raciocínio e sistemas autônomos,” explicou Huang, abordando diretamente o desafio apresentado por modelos mais eficientes, como o da DeepSeek. Em vez de posicionar modelos eficientes como uma ameaça ao modelo de negócios da Nvidia, Huang os enquadrou como um impulsionador da demanda crescente por computação — transformando efetivamente uma potencial fraqueza em uma força.

Arquitetura Rubin de próxima geração revelada com um claro roteiro de vários anos

Em um movimento claramente projetado para dar confiança aos clientes empresariais e provedores de nuvem na trajetória de longo prazo da Nvidia, Huang delineou um roteiro detalhado para a infraestrutura de computação em IA até 2027. Este nível incomum de transparência sobre produtos futuros para uma empresa de hardware reflete os longos ciclos de planejamento exigidos para infraestrutura de IA.

“Temos um ritmo anual de roteiros que foi elaborado para que você pudesse planejar sua infraestrutura de IA,” afirmou Huang, enfatizando a importância da previsibilidade para clientes que fazem enormes investimentos de capital.

O roteiro inclui Blackwell Ultra, que chegará no segundo semestre de 2025, oferecendo 1,5 vezes mais desempenho em IA em comparação com os chips Blackwell atuais. Isso será seguido pelo Vera Rubin, nomeado em homenagem à astrônoma que descobriu a matéria escura, no segundo semestre de 2026. O Rubin contará com um novo CPU que é duas vezes mais rápido que o atual Grace CPU, além de uma nova arquitetura de rede e sistemas de memória.

“Basicamente tudo é completamente novo, exceto o chassi,” explicou Huang sobre a plataforma Vera Rubin.

O roteiro se estende ainda mais até o Rubin Ultra no segundo semestre de 2027, que Huang descreveu como um “escalonamento extremo” oferecendo 14 vezes mais potência computacional do que os sistemas atuais. “Você pode ver que o Rubin vai reduzir significativamente os custos,” observou ele, abordando preocupações sobre a economia da infraestrutura de IA.

Esse roteiro detalhado é a resposta da Nvidia às preocupações do mercado sobre a competição e a sustentabilidade dos investimentos em IA, efetivamente informando clientes e investidores que a empresa tem um caminho claro a seguir, independentemente de como a eficiência dos modelos de IA evolua.

Nvidia Dynamo surge como o ‘sistema operacional’ para fábricas de IA

Um dos anúncios mais significativos foi o Nvidia Dynamo, um sistema de software de código aberto projetado para otimizar a inferência de IA. Huang o descreveu como “basicamente o sistema operacional de uma fábrica de IA,” fazendo uma comparação com como data centers tradicionais dependem de sistemas operacionais como VMware para orquestrar aplicativos empresariais.

O Dynamo aborda o desafio complexo de gerenciar cargas de trabalho de IA em sistemas de GPU distribuídos, manipulando tarefas como paralelismo de pipeline, paralelismo de tensores, paralelismo de especialistas, agrupamento em trânsito, inferência desagregada e gerenciamento de cargas de trabalho. Esses desafios técnicos tornaram-se cada vez mais importantes à medida que os modelos de IA crescem em complexidade e abordagens baseadas em raciocínio exigem mais computação.

O sistema recebe seu nome do dínamo, que, conforme Huang observou, foi “o primeiro instrumento que iniciou a última Revolução Industrial, a revolução industrial da energia.” A comparação posiciona o Dynamo como uma tecnologia fundamental para a revolução da IA.

Ao tornar o Dynamo de código aberto, a Nvidia está tentando fortalecer seu ecossistema e garantir que seu hardware permaneça a plataforma preferida para cargas de trabalho em IA, mesmo quando a otimização de software se torna cada vez mais importante para o desempenho e eficiência. Parceiros como a Perplexity já estão trabalhando com a Nvidia na implementação do Dynamo.

“Estamos tão felizes que tantos de nossos parceiros estão trabalhando conosco nisso,” disse Huang, destacando especificamente a Perplexity como “um dos meus parceiros favoritos” devido ao “trabalho revolucionário que eles realizam.”

A abordagem de código aberto é uma manobra estratégica para manter a posição central da Nvidia no ecossistema de IA enquanto reconhece a importância da otimização de software além do desempenho bruto do hardware.

IA física e robótica ganham destaque com o modelo Groot N1 de código aberto

Em um dos momentos mais visualmente impactantes da palestra, Huang revelou um grande impulso na robótica e na IA física, culminando com a aparição de “Blue,” um robô inspirado em Star Wars que entrou no palco e interagiu com Huang.

“Até o final desta década, o mundo estará pelo menos 50 milhões de trabalhadores em falta,” explicou Huang, posicionando a robótica como uma solução para a escassez de mão de obra global e uma enorme oportunidade de mercado.

A empresa anunciou o Nvidia Isaac Groot N1, descrito como “o primeiro modelo de fundação aberto e completamente personalizável para raciocínio e habilidades humanoides generalizadas.” Tornar este modelo de código aberto representa um movimento significativo para acelerar o desenvolvimento no campo da robótica, semelhante à forma como os LLMs de código aberto aceleraram o desenvolvimento da IA geral.

Junto ao Groot N1, a Nvidia anunciou uma parceria com a Google DeepMind e a Disney Research para desenvolver Newton, um motor de física de código aberto para simulação de robótica. Huang explicou a necessidade de “um motor de física que seja projetado para corpos rígidos e macios, que possa treinar feedback tátil, controle motor fino e controle de atuadores.”

O foco na simulação para treinamento de robôs segue o mesmo padrão que tem se mostrado bem-sucedido no desenvolvimento de condução autônoma, usando dados sintéticos e aprendizado por reforço para treinar modelos de IA sem as limitações da coleta de dados físicos.

“Usar o Omniverse para condicionar o Cosmos, e o Cosmos para gerar um número infinito de ambientes, nos permite criar dados que são fundamentados, controlados por nós e, ao mesmo tempo, sistematicamente infinitos,” explicou Huang, descrevendo como as tecnologias de simulação da Nvidia permitem o treinamento de robôs em escala.

Esses anúncios sobre robótica representam a expansão da Nvidia além da computação tradicional em IA para o mundo físico, potencialmente abrindo novos mercados e aplicações para sua tecnologia.

Parceria com a GM sinaliza um grande impulso em veículos autônomos e IA industrial

Concluindo a estratégia da Nvidia de estender a IA dos data centers para o mundo físico, Huang anunciou uma parceria significativa com a General Motors para “construir sua futura frota de carros autônomos.”

“A GM escolheu a Nvidia para ser seu parceiro na construção de sua futura frota de carros autônomos,” anunciou Huang. “O momento para veículos autônomos chegou, e estamos ansiosos para construir com a GM em todas as três áreas: IA para fabricação, para revolucionar a forma como fabricam; IA para empresas, para revolucionar a forma como trabalham, projetam e simulam carros; e, por fim, IA para dentro dos carros.”

Esta parceria é um voto de confiança significativo na tecnologia de veículos autônomos da Nvidia por parte do maior fabricante de automóveis da América. Huang observou que a Nvidia está trabalhando em carros autônomos há mais de uma década, inspirados pelo desempenho inovador do AlexNet em competições de visão computacional.

“O momento em que vi o AlexNet foi um momento inspirador e emocionante, que nos levou a decidir investir tudo na construção de carros autônomos,” lembrou Huang.

Além da parceria com a GM, a Nvidia anunciou o Halos, descrito como “um sistema de segurança abrangente” para veículos autônomos. Huang enfatizou que a segurança é uma prioridade que “raramente recebe atenção,” mas que requer tecnologia “do silício aos sistemas, o software do sistema, os algoritmos, as metodologias.”

Os anúncios no setor automotivo expandem o alcance da Nvidia dos data centers para fábricas e veículos, posicionando a empresa para capturar valor em toda a pilha de IA e em várias indústrias.

O arquiteto da segunda fase da IA: a evolução estratégica da Nvidia além dos chips

O GTC 2025 revelou a transformação da Nvidia de fabricante de GPU para uma empresa de infraestrutura de IA de ponta a ponta. Através do roteiro Blackwell para Rubin, Huang sinalizou que a Nvidia não abrirá mão de sua dominância computacional, enquanto sua mudança em direção a software de código aberto (Dynamo) e modelos (Groot N1) reconhece que apenas o hardware não pode garantir seu futuro.

A Nvidia reformulou de forma inteligente o desafio da eficiência do DeepSeek, argumentando que modelos mais eficientes irão impulsionar um maior total de computação à medida que o raciocínio em IA se expanda — embora os investidores tenham permanecido céticos, fazendo com que as ações caíssem apesar do roteiro abrangente.

O que distingue a Nvidia é a visão de Huang além do silício. A iniciativa de robótica não se trata apenas de vender chips; trata-se de criar novos paradigmas computacionais que exigem enormes recursos computacionais. Da mesma forma, a parceria com a GM posiciona a Nvidia no centro da transformação da IA automotiva, abrangendo fabricação, design e os próprios veículos.

A mensagem de Huang foi clara: a Nvidia compete com visão, não apenas com preço. À medida que a computação se estende dos data centers para dispositivos físicos, a Nvidia aposta que controlar toda a pilha de IA — do silício à simulação — definirá a próxima fronteira da computação. No mundo de Huang, a revolução da IA está apenas começando, e desta vez, ela está saindo da sala de servidores.





    12 + 10 =




    Bolt42