Bolt42

Jensen Huang, CEO da Nvidia, abordou muitos conceitos avançados e terminologias técnicas em seu discurso de abertura do GTC 2025 na última terça-feira, no imenso SAP Center em San Jose, Califórnia. A minha principal conclusão foi que os robôs humanoides e os carros autônomos estão chegando mais rápido do que imaginamos.

Huang, que lidera uma das empresas mais valiosas do planeta, com um valor de mercado de $2,872 trilhões, falou sobre dados sintéticos e como novos modelos permitirão que robôs humanoides e carros autônomos cheguem ao mercado em uma velocidade mais rápida.

Ele também observou que estamos prestes a passar de um tipo de computação intensiva em dados, baseada em recuperação, para uma forma diferente possibilitada pela IA: a computação generativa, onde a IA raciocina uma resposta e fornece a informação, em vez de um computador buscar dados na memória para apresentá-los.

Fiquei fascinado com a forma como Huang transitou entre os assuntos com facilidade, sem um roteiro. Porém, houve momentos em que precisei de um intérprete para compreender melhor o contexto. Alguns tópicos profundos, como robôs humanoides, gêmeos digitais, a interseção com jogos e a simulação Earth-2, que usa muitos supercomputadores para analisar tanto os efeitos das mudanças climáticas globais quanto locais, e o clima diário.

Logo após a palestra principal, conversei com Dion Harris, diretor sênior do grupo de soluções de IA e HPC da Nvidia, para obter mais contexto sobre os anúncios feitos por Huang.

Abaixo está uma transcrição editada da nossa entrevista.

Dion Harris, diretor sênior do grupo de soluções de IA e HPC da Nvidia, está no SAP Center após o discurso de abertura do GTC 2025 de Jensen Huang.

VentureBeat: Você possui algo específico na palestra que esteve lá?

Harris: Trabalhei nas duas primeiras horas da palestra. Tudo que esteve relacionado às fábricas de IA, até que ele passou para o setor empresarial. Nós estamos muito envolvidos em tudo isso.

VentureBeat: Estou sempre interessado nos gêmeos digitais e na simulação Earth-2. Recentemente, entrevistei o CTO da Ansys, falando sobre a lacuna entre simulação e realidade. Quão longe você acha que chegamos nisso?

Harris: Houve um clipe que ele mostrou, logo após as bibliotecas CUDA-X. Isso foi interessante na descrição da jornada em termos de fechar a lacuna de simulação para a realidade. Isso descreve como temos estado nesse caminho para computação acelerada, acelerando aplicações para que funcionem mais rápido e de maneira mais eficiente. Agora, com a IA sendo incorporada, estamos criando essa aceleração em tempo real em termos de simulação. Mas, é claro, você precisa da visualização, que a IA também está ajudando. Você tem essa confluência interessante de simulação central acelerando para treinar e construir IA. Você tem capacidades de IA que estão permitindo que a simulação funcione muito mais rápido e traga precisão. Você também tem a IA ajudando nos elementos de visualização necessários para criar essas visualizações informadas por física de sistemas complexos.

Quando você pensa em algo como Earth-2, é a culminância de essas três tecnologias centrais: simulação, IA e visualização avançada. Para responder a sua pergunta sobre quão longe chegamos, só nos últimos anos, trabalhando com pessoas como Ansys, Cadence e todos esses outros ISVs que construíram legados e expertise em simulação central, e então se associando com pessoas que constroem modelos de IA e abordagens baseadas em IA–acreditamos que estamos em um ponto de inflexão, onde veremos um grande crescimento em gêmeos digitais informados por física e baseados na realidade. Há muito trabalho excitante acontecendo.

Nvidia Isaac GR00T facilita o design de robôs humanoides.

VentureBeat: Ele começou com esse conceito de computação bem no início, falando sobre como estamos mudando de computação baseada em recuperação para computação generativa. Isso é algo que eu não havia notado [anteriormente]. Parece que isso poderia ser tão disruptivo que teria um impacto neste espaço também. Gráficos 3D sempre foram um tipo de computação muito pesada em dados. Isso está sendo aliviado pela IA?

Harris: Vou usar uma frase que é muito contemporânea dentro da IA. É chamada de geração aumentada por recuperação. Usam isso em um contexto diferente, mas vou usá-la para explicar a ideia aqui também. Ainda haverá elementos de recuperação, é claro. Obviamente, se você é uma marca, deseja manter a integridade do design do seu carro, os elementos da sua marca, seja materiais, cores, o que você tiver. Mas haverá elementos dentro do princípio ou prática de design que podem ser gerados. Será uma mistura de recuperação, tendo ativos de banco de dados armazenados e classes de objetos ou imagens, mas haverá muitos elementos gerados que ajudam a agilizar isso, para que você não tenha que calcular tudo.

Isso remete ao que Jensen estava descrevendo no início, onde ele falou sobre como o ray tracing funcionava. Pegando um que foi calculado e usando IA para gerar os outros 15. O processo de design parecerá muito semelhante. Você terá alguns ativos que são baseados em recuperação, que estão muito enraizados em um conjunto específico de artefatos ou ativos de propriedade intelectual que você precisa construir, elementos específicos. Então, haverá outras partes que serão completamente geradas, porque são elementos onde você pode usar IA para ajudar a preencher as lacunas.

VentureBeat: Uma vez que você se torna mais rápido e mais eficiente, começa a aliviar o peso de todos esses dados.

Harris: A velocidade é legal, mas é realmente interessante quando você pensa nos novos tipos de fluxos de trabalho que isso possibilita, as coisas que você pode fazer em termos de explorar diferentes espaços de design. É aí que você vê o potencial do que a IA pode fazer. Você vê certos designers terem acesso a algumas das ferramentas e entender que podem explorar milhares de possibilidades. Você falou sobre Earth-2. Uma das coisas mais fascinantes sobre o que alguns dos modelos de IA substitutivos permitem que você faça não é apenas fazer uma única previsão mil vezes mais rápida, mas ser capaz de fazer mil previsões. Obtendo uma representação estocástica de todos os possíveis resultados, para que você tenha uma visão muito mais informada sobre como tomar uma decisão, em vez de ter uma visão muito limitada. Porque é tão intensivo em recursos que você não consegue explorar todas as possibilidades. Você precisa ser muito prescritivo no que você persegue e simula. Acreditamos que a IA criará um novo conjunto de possibilidades para fazer as coisas de maneira muito diferente.

Earth-2 no evento GTC 2024 da Nvidia.

VentureBeat: Com Earth-2, você poderia dizer: “Estava nublado aqui ontem. Estava nublado aqui há uma hora. Ainda está nublado.”

Harris: Eu levaria isso um passo adiante e diria que você poderia entender não apenas o impacto da neblina agora, mas você poderia entender uma série de possibilidades sobre onde as coisas estarão duas semanas no futuro. Obtendo visões muito localizadas e regionalizadas disso, em vez de fazer generalizações amplas, que é como a maioria das previsões é usada agora.

VentureBeat: O avanço particular que temos no Earth-2 hoje, qual era mesmo?

Harris: Não houve muitos anúncios na palestra, mas temos feito um trabalho enorme durante todo o ecossistema de tecnologia climática apenas em termos de cronograma. No ano passado, na Computex, revelamos o trabalho que temos feito com a administração climática de Taiwan. Isso demonstrou o CorrDiff na região de Taiwan. Mais recentemente, na Supercomputing, fizemos uma atualização do modelo, ajustando e treinando-o em um conjunto de dados dos EUA. Uma geografia muito maior, totalmente diferente em terrenos e padrões climáticos para aprender. Demonstrando que a tecnologia está tanto avançando quanto escalando.

Imagem Credit: Nvidia

Harris: À medida que olhamos para algumas das outras regiões com as quais estamos trabalhando–no evento, anunciamos que estamos trabalhando com a G42, que é baseada nos Emirados. Eles estão pegando o CorrDiff e construindo em cima da plataforma deles para construir modelos regionais para seus padrões climáticos específicos. Muito parecido com o que você descreveu sobre os padrões de neblina, eu supus que a maioria dos desafios de previsão e clima deles seriam sobre coisas como tempestades de areia e ondas de calor. Mas eles estão realmente muito preocupados com a neblina. Essa é uma coisa que eu nunca soube. Muitos dos sistemas meteorológicos deles são usados para ajudar a gerenciar a neblina, especialmente para transporte e infraestrutura que depende dessa informação. É um caso de uso interessante, onde temos trabalhado com eles para implantar o Earth-2 e o CorrDiff específico para prever isso em um nível muito local.

VentureBeat: Está realmente obtendo um uso muito prático, então?

Harris: Absolutamente.

VentureBeat: Quanta detalhe existe lá agora? Em que nível de detalhe você tem tudo sobre a Terra?

Harris: O Earth-2 é um projeto ambicioso. Vamos construí-lo peça por peça até chegar ao estado final que falamos, o gêmeo digital completo da Terra. Temos feito simulação há bastante tempo. Com IA, obviamente, temos feito algum trabalho em previsões e adotando outros modelos baseados em IA. O CorrDiff é uma abordagem única, uma vez que pega qualquer conjunto de dados e o super-resolve. Mas você precisa treiná-lo nos dados regionais.

Se você pensar no globo como um patchwork de regiões, é assim que estamos fazendo. Começamos com Taiwan, como mencionei. Expandimos para os Estados Unidos continentais. Expansamos para a análise das regiões da EMEA, trabalhando com algumas agências meteorológicas lá para usar seus dados e treiná-los para criar adaptações do modelo CorrDiff. Trabalhamos com a G42. Será um esforço região por região. Depende de algumas coisas. Primeiro, ter os dados, seja os dados observados ou os dados simulados ou os dados históricos para treinar os modelos regionais. Há muitos dados disponíveis. Trabalhamos com muitas agências regionais. E então também tornar o computação e as plataformas disponíveis para isso.

A boa notícia é que estamos comprometidos. Sabemos que será um projeto de longo prazo. Através do ecossistema se unindo para fornecer os dados e juntar a tecnologia, parece que estamos em uma boa trajetória.

VentureBeat: É interessante como esses dados são difíceis de obter. Eu pensei que os satélites lá em cima simplesmente voariam algumas vezes e você teria tudo.

Harris: Essa é uma fonte de dados totalmente diferente, pegando todos os dados geoespaciais. Em alguns casos, porque esses dados são proprietários – estamos trabalhando com algumas empresas geoespaciais, por exemplo, Tomorrow.io. Eles têm dados de satélite que usamos para capturar – no clipe que abriu a palestra, você viu o satélite sobrevoando o planeta. Essas foram algumas imagens que pegamos da Tomorrow.io especificamente. A OroraTech é outra com a qual trabalhamos. Para o seu ponto, há muitos dados geoespaciais observados de satélite que podemos e fazemos usar para treinar alguns desses modelos regionais também.

VentureBeat: Como chegamos a uma imagem completa da Terra?

Harris: Um dos elementos mágicos da plataforma Earth-2 é o OmniVerse. Ele permite que você ingresse em vários tipos diferentes de dados e os una usando consistência temporal, consistência espacial, mesmo que sejam dados de satélite versus dados simulados versus outros dados de sensores observacionais. Quando você olha para essa questão – por exemplo, estávamos falando de satélites. Estávamos conversando com um dos parceiros. Eles têm ótimos detalhes, porque eles literalmente escaneiam a Terra todos os dias à mesma hora. Eles estão em uma trajetória orbital que lhes permite capturar cada faixa da Terra todos os dias. Mas isso não possui uma grande granularidade temporal. É aí que você quer pegar os dados espaciais que podemos obter de uma empresa de satélites, mas então também pegar os dados de simulação de modelagem para preencher as lacunas temporais.

É pegar todas essas diferentes fontes de dados e uni-las através da plataforma OmniVerse que, em última análise, nos permitirá entregar contra isso. Não será limitado por nenhuma abordagem ou modalidade. Essa flexibilidade nos oferece um caminho para alcançar esse objetivo.

VentureBeat: A Microsoft, com o Flight Simulator 2024, mencionou que há alguns casos em que os países não querem divulgar seus dados. [Esses países perguntaram:] “O que você vai fazer com esses dados?”

Harris: O espaço aéreo realmente apresenta uma limitação nessa questão. Você tem que sobrevoar. O satélite, obviamente, pode capturar a uma altitude muito maior.

VentureBeat: Com um gêmeo digital, isso é apenas um problema muito mais simples? Ou você esbarra em outros desafios, como uma fábrica da BMW? São apenas alguns metros quadrados. Não é o planeta inteiro.

Harris: É um problema diferente. Com a Terra, é um sistema tão caótico. Você está tentando modelar e simular ar, vento, calor, umidade. Existem todas essas variáveis que você tem que simular ou contabilizar. Esse é o verdadeiro desafio da Terra. Não é tanto a escala, mas a complexidade do próprio sistema.

A coisa mais complicada sobre modelar uma fábrica é que não é tão determinístico. Você pode mover as coisas. Você pode mudar as coisas. Seus desafios de modelagem são diferentes porque você está tentando otimizar um espaço configurável em vez de prever um sistema caótico. Isso cria uma dinâmica muito diferente em como você aborda. Mas ambos são complexos. Eu não subestimaria e diria que ter um gêmeo digital de uma fábrica não é complexo. É apenas um tipo diferente de complexidade. Você está tentando alcançar um objetivo diferente.

VentureBeat: Você sente que coisas como as fábricas estão bem dominadas neste ponto? Ou você também precisa de mais e mais poder computacional?

Harris: É um problema que consome muitos recursos computacionais, com certeza. O benefício central em termos de onde estamos agora é que há um reconhecimento bastante amplo do valor de produzir muitos desses gêmeos digitais. Temos uma incrível tração não apenas dentro da comunidade ISV, mas também entre usuários finais. Aqueles slides que mostramos lá em cima, quando ele estava clicando, muitos dos casos de uso empresariais envolvem a construção de gêmeos digitais de processos ou instalações de fabricação específicas. Há uma aceitação geral de que, se você pode modelar e simular primeiro, pode implantar de forma muito mais eficiente. Onde há oportunidades para entregar mais eficiência, há oportunidades para aproveitar as capacidades de simulação. Já há muito sucesso, mas ainda acho que há muita oportunidade.

VentureBeat: Em janeiro, Jensen falou muito sobre dados sintéticos. Ele estava explicando o quão perto estamos de ter robôs e carros autônomos realmente bons por causa de dados sintéticos. Você dirige um carro bilhões de milhas em uma simulação e só precisa dirigi-lo um milhão de milhas na vida real. Você sabe que ele foi testado e que vai funcionar.

Harris: Ele fez alguns pontos-chave hoje. Tentarei resumir. A primeira coisa que ele destacou foi descrever como as leis de escalonamento se aplicam à robótica. Especificamente para o ponto que ele mencionou, a geração sintética. Isso proporciona uma oportunidade incrível para elementos de pré-treinamento e pós-treinamento que são introduzidos em todo esse fluxo de trabalho. O segundo ponto que ele destacou também estava relacionado a isso. Liberamos, ou disponibilizamos, nosso próprio conjunto de dados sintéticos.

Acreditamos que duas coisas acontecerão. Primeiro, ao desbloquear esse conjunto de dados e torná-lo disponível, você obtém muito mais adoção e muitas mais pessoas adotando e construindo em cima disso. Acreditamos que isso inicia a roda, a roda de dados que temos visto acontecer no espaço da IA virtual. A lei de escalonamento ajuda a gerar mais dados através desse fluxo de trabalho de pós-treinamento, e então nós disponibilizando nosso próprio conjunto de dados deve encorajar ainda mais a adoção também.

VentureBeat: De volta às coisas que estão acelerando robôs para que estejam em toda parte em breve, houve algumas outras grandes coisas que vale a pena notar?

Harris: Novamente, há uma série de mega-tendências que estão acelerando o interesse e o investimento em robótica. A primeira coisa que foi um pouco solta, mas eu acho que ele conectou os pontos no final – é basicamente a evolução dos modelos de raciocínio e pensamento. Quando você pensa em quão dinâmica é o mundo físico, qualquer tipo de máquina ou robô autônomo, seja humanoide ou um transportador ou qualquer outra coisa, precisa ser capaz de interagir, se adaptar, pensar e se engajar espontaneamente. O avanço dos modelos de raciocínio, sendo capaz de entregar essa capacidade como uma IA, tanto virtual quanto fisicamente, ajudará a criar um ponto de inflexão para a adoção.

Agora a IA se tornará muito mais inteligente, muito mais provável de poder interagir com todas as variáveis que acontecem. Ela chegará àquela porta e verá que está trancada. O que eu faço? Esse tipo de capacidade de raciocínio, você pode construí-la na IA. Vamos recuar. Vamos encontrar outro local. Isso vai ser um grande motor para avançar algumas das capacidades dentro da IA física, essas capacidades de raciocínio. Isso é muito do que ele falou na primeira metade, descrevendo por que Blackwell é tão importante, descrevendo por que a inferência é tão importante em termos de implantar essas capacidades de raciocínio, tanto no centro de dados quanto na borda.

VentureBeat: Eu estava observando um Waymo em um cruzamento perto do GDC outro dia. Todas essas pessoas atravessaram a rua e então ainda mais começaram a atravessar fora da faixa. O Waymo está educadamente esperando lá. Nunca vai se mover. Se fosse um humano, começaria a avançar lentamente. Ei, pessoal, me deixe passar. Mas um Waymo não arriscaria isso.

Harris: Quando você pensa no mundo real, é muito caótico. Ele não segue sempre as regras. Há todas essas circunstâncias espontâneas em que você precisa pensar, raciocinar e inferir em tempo real. É aí que, à medida que esses modelos se tornam mais inteligentes, tanto virtual quanto fisicamente, fará com que muitos dos casos de uso da IA física sejam muito mais viáveis.

VentureBeat: O Nvidia Omniverse está crescendo.

VentureBeat: Há mais alguma coisa que você gostaria de cobrir hoje?

Harris: A única coisa que eu tocaria brevemente – estávamos falando sobre inferência e a importância de alguns dos trabalhos que estamos fazendo em software. Somos conhecidos como uma empresa de hardware, mas ele gastou um bom tempo descrevendo o Dynamo e preâmbulo a importância disso. É um problema muito difícil de resolver, e é por isso que as empresas poderão implantar IA em larga escala. Agora, à medida que estão passando do conceito de prova para a produção, é onde a borracha realmente vai encontrar a estrada em termos de colher os frutos da IA. É através da inferência. Muito do trabalho que temos feito tanto em hardware quanto em software desbloqueará muitos dos casos de uso da IA virtual, os elementos de IA agentiva, subindo essa curva que ele destacou e, é claro, a IA física também.

Harris: O Dynamo ser open source ajudará a impulsionar a adoção. Ser capaz de se conectar a outros tempos de execução de inferência, seja olhando para o SGLang ou vLLM, permitirá que você tenha uma tração muito mais ampla e se torne a camada padrão, o sistema operacional padrão para aquele centro de dados.

GB Daily

Fique por dentro! Receba as últimas notícias na sua caixa de entrada diariamente

Leia nossa Política de Privacidade

Obrigado por se inscrever. Confira mais newsletters da VB aqui.

Ocorreu um erro.


    dez + 11 =

    Bolt42