O novo modelo de raciocínio em código aberto da DeepSeek, chamado R1, provocou uma queda nas ações da Nvidia e fez com que seu aplicativo consumidor disparasse para o topo das lojas de aplicativos.
No mês passado, a DeepSeek anunciou que treinou um modelo utilizando um centro de dados com cerca de 2.000 GPUs H800 da Nvidia em aproximadamente dois meses, a um custo de cerca de US$ 5,5 milhões. Na semana passada, publicou um artigo mostrando que o desempenho de seu modelo mais recente corresponde aos modelos de raciocínio mais avançados do mundo. Esses modelos estão sendo treinados em centros de dados que estão gastando bilhões em chips de IA, que são mais rápidos e muito caros da Nvidia.
A reação da indústria de tecnologia ao modelo de alto desempenho e baixo custo da DeepSeek tem sido extrema. Pat Gelsinger, por exemplo, se manifestou no X com entusiasmo, postando: “Obrigado, equipe DeepSeek.”
Gelsinger é, claro, o ex-CEO da Intel, um engenheiro de hardware e atual presidente de sua própria startup Gloo, que está na fila para uma IPO, uma plataforma de mensagens e engajamento para igrejas. Ele deixou a Intel em dezembro após quatro anos e uma tentativa de alcançar a Nvidia com os chips de IA Gaudi 3 da Intel.
Gelsinger escreveu que a DeepSeek deve lembrar a indústria de tecnologia de suas três lições mais importantes: custos mais baixos significam uma adoção mais ampla; a engenhosidade floresce sob restrições; e “o aberto vence. A DeepSeek ajudará a redefinir o mundo cada vez mais fechado do trabalho com modelos fundamentais de IA,” escreveu ele. A OpenAI e a Anthropic são ambas fechadas.
Gelsinger disse ao TechCrunch que o R1 é tão impressionante que a Gloo já decidiu não adotar nem pagar pela OpenAI. A Gloo está construindo um serviço de IA chamado Kallm, que oferecerá um chatbot e outros serviços.
“Meus engenheiros da Gloo estão rodando o R1 hoje,” disse ele. “Eles poderiam ter rodado o o1 — bem, só têm acesso ao o1, através das APIs.”
Em vez disso, em duas semanas, a Gloo espera ter reconstruído o Kallm do zero “com nosso próprio modelo fundamental que é totalmente de código aberto,” disse ele. “Isso é empolgante.”
Ele acredita que a DeepSeek tornará a IA tão acessível que a IA estará não apenas em toda parte. A boa IA estará em toda parte. “Eu quero uma IA melhor no meu Oura Ring. Eu quero uma IA melhor no meu aparelho auditivo. Quero mais IA no meu telefone. Quero uma IA melhor nos meus dispositivos embutidos, como o reconhecimento de voz no meu carro elétrico,” diz ele.
A reação feliz de Gelsinger pode ter sido em desacordo com outros que estavam menos entusiasmados com o fato de que os modelos fundamentais de raciocínio agora têm um concorrente mais acessível e de melhor desempenho. A IA tem se tornado cada vez mais cara, e não menos.
Outros reagiram insinuando que a DeepSeek de alguma forma deve ter manipulado seus números e que o treinamento deve ter sido mais caro. Alguns pensaram que não poderia afirmar que usou chips de ponta devido às restrições de exportação de chips de IA dos EUA para a China. Outros estavam apontando falhas em seu desempenho, encontrando pontos onde outros modelos se saíram melhor. Ainda outros acreditam que o próximo modelo da OpenAI, o o3, superará tanto o R1 quando for lançado, restaurando o status quo.
Gelsinger ignora tudo isso. “Você nunca terá total transparência, já que a maior parte do trabalho foi feita na China,” disse ele. “Mas ainda assim, todas as evidências indicam que é de 10 a 50 vezes mais barato em seu treinamento do que o o1.”
A DeepSeek prova que a IA pode avançar “através da criatividade em engenharia, não apenas jogando mais poder de hardware e recursos computacionais no problema. Isso é emocionante,” disse ele.
Quanto a este ser um desenvolvedor chinês com tudo que isso implica, como preocupações sobre privacidade e censura, Gelsinger metaforicamente balança a cabeça.
“Ter os chineses nos lembrando do poder de ecossistemas abertos é talvez um pouco constrangedor para nossa comunidade, para o mundo ocidental,” disse ele.
A TechCrunch tem um boletim informativo focado em IA! Inscreva-se aqui para recebê-lo na sua caixa de entrada toda quarta-feira.
Conteúdo relacionado
Clutch capta US$ 20 milhões para desenvolver sua plataforma de identificação de segurança não-humana.
[the_ad id="145565"] No universo da cibersegurança, a identidade é frequentemente vista como uma “fronteira” em torno de uma organização. Muitas violações começam através de…
Ex-engenheiros do Google e Apple lançam a plataforma de IA Oumi, totalmente open source, que pode ajudar a construir o próximo DeepSeek.
[the_ad id="145565"] Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder da indústria. Saiba mais…
Disrupt 2025: Restam apenas 3 dias para o Passe 2 por 1!
[the_ad id="145565"] Restam apenas 3 dias para garantir o negócio incrível do TechCrunch Disrupt 2025 — dois ingressos do mesmo tipo pelo preço de um! Não perca a chance de…