No palco da conferência GTC 2025 da Nvidia em San Jose na terça-feira, o CEO Jensen Huang anunciou uma série de novas GPUs que estarão disponíveis no pipeline de produtos da empresa nos próximos meses.
Talvez a mais significativa seja a Vera Rubin. A Vera Rubin, que está programada para ser lançada na segunda metade de 2026, contará com dezenas de gigabytes de memória e um CPU personalizado da Nvidia chamado Vera. A Nvidia alega que a Vera Rubin oferece aumentos substantivos de desempenho em comparação com seu predecessor, Grace Blackwell, especialmente em tarefas de inferência e treinamento de IA.
Quando emparelhada com Vera, Rubin — que tecnicamente é duas GPUs em uma — pode gerenciar até 50 petaflops durante a inferência (ou seja, executando modelos de IA), mais do que o dobro dos 20 petaflops dos chips atuais Blackwell da Nvidia. Além disso, Vera é cerca de duas vezes mais rápida do que o CPU usado na GPU Grace Blackwell da Nvidia.
A Rubin será seguida pela Rubin Ultra na segunda metade de 2027, um conjunto de quatro GPUs em um único pacote que entregará até 100 petaflops de desempenho.
No horizonte próximo — H2 2025 — a Nvidia lançará a Blackwell Ultra, uma GPU que virá em várias configurações. Um único chip Ultra oferecerá os mesmos 20 petaflops de desempenho em IA que a Blackwell, mas com 288GB de memória — um aumento em relação aos 192GB da Blackwell convencional.
No horizonte distante estão as GPUs Feynman. Huang, durante a apresentação, deu poucos detalhes sobre a arquitetura do Feynman, nomeada em homenagem ao físico teórico americano Richard Feynman, exceto que contará com um CPU Vera. A Nvidia planeja lançar o Feynman, que sucederá a Rubin Vera, no mercado em algum momento de 2028.
Atualizado em 18/03 às 15:07, horário do Pacífico: Uma versão anterior desta história indicou que a Vera Rubin tinha “dezenas de terabytes” de memória. Na verdade, ela possui “dezenas de gigabytes” de memória. Lamentamos o erro.
Conteúdo relacionado
De Palavras a Conceitos: Como os Grandes Modelos de Conceitos Estão Redefinindo a Compreensão e Geração de Linguagem
[the_ad id="145565"] Nos últimos anos, modelos de linguagem grandes (LLMs) avançaram significativamente na geração de texto semelhante ao humano, na tradução de idiomas e na…
Além do RAG: SEARCH-R1 integra motores de busca diretamente nos modelos de raciocínio
[the_ad id="145565"] Participe das nossas newsletters diárias e semanais para as últimas atualizações e conteúdos exclusivos sobre a cobertura de IA líder da indústria. Saiba…
Aqui está o motivo pelo qual o Google apresentou sua aquisição de $32 bilhões da Wiz como ‘multicloud’
[the_ad id="145565"] A grande notícia de terça-feira sobre a aquisição da startup de segurança Wiz pelo Google por um valor recorde de $32 bilhões vem acompanhada de uma…