Bolt42

Em um único dia da semana passada, a gigante de chips NVIDIA viu suas ações despencarem 17%, eliminando impressionantes $600 bilhões em valor de mercado—reportadamente a maior perda em um único dia já registrada por uma empresa dos EUA.

A causa? DeepSeek, um laboratório de IA chinês que acaba de lançar modelos de pesos abertos, que afirma rivalizar o desempenho dos desenvolvidos por laboratórios de IA líderes a uma fração do custo.

Na semana passada no The Artificial Intelligence Show, discutimos a entrada disruptiva da DeepSeek na corrida armamentista de IA. No Episódio 134, eu e Paul Roetzer, fundador e CEO do Marketing AI Institute, analisamos as implicações maiores da DeepSeek à medida que a poeira começa a assentar.

Aqui estão os pontos principais que você precisa saber.

O Dia em que os Mercados Entraram em Pânico

Quase da noite para o dia, o novo modelo V3 da DeepSeek (posicionado como um concorrente do GPT-4o) e o modelo R1 (rivalizando com modelos de raciocínio avançado) levaram o setor de tecnologia a um redemoinho por causa de uma única afirmação audaciosa:

As manchetes clamavam que a DeepSeek alcançou desempenho equivalente ao dos melhores modelos do mercado, gastando apenas $6 milhões em seu modelo V3, uma fração do custo necessário para construir o GPT-4o e outros modelos comparáveis.

Se a DeepSeek realmente pudesse igualar o desempenho de gigantes como OpenAI e Google—e fazer isso por milhões de dólares em vez de bilhões—isso mudaria tudo. Os investidores começaram imediatamente a questionar se os mega-orçamentos para treinamento de IA realmente faziam sentido. Isso causou a queda acentuada nas ações da NVIDIA. Microsoft, Meta e Google também sofreram grandes perdas.

Mas a verdade é um pouco mais obscura. E Roetzer acredita que muitos investidores simplesmente reagiram muito rapidamente.

“Acho que foi principalmente uma super-reação porque as pessoas não entendiam realmente o que estava acontecendo ou quais eram as implicações,” ele diz.

Relatórios agora surgiram indicando que o preço de $6 milhões é muito provavelmente enganoso. O CEO da Anthropic, Dario Amodei, em um novo ensaio, afirma claramente que “a DeepSeek não ‘faz por $6M o que custa bilhões para as empresas de IA dos EUA.’” As manchetes equipararam os $6 milhões com o custo total do modelo. Na verdade, era provavelmente o custo de uma corrida de treinamento, não o total investido nos chips, engenharia e pesquisa necessárias para criar o modelo V3 da DeepSeek—ou qualquer um de seus outros modelos.

“Acho que é seguro dizer que aquelas manchetes da mídia estavam distorcendo o que realmente estava acontecendo,” diz Roetzer.

Agora, isso não torna a DeepSeek menos impactante. É importante, apenas por outros motivos.

Sam Altman: “Estamos no Lado Errado da História”  

Andrew Ng, cofundador da equipe Google Brain e uma autoridade em IA, se manifestou no X, dizendo que a DeepSeek cristalizou algumas tendências fundamentais que estavam “escondidas à vista de todos”:

Essas incluem:

  1. A China está alcançando na IA generativa, com sérias implicações para a cadeia de suprimentos global.
  2. Modelos de pesos abertos estão comoditizando a camada “modelo fundamental”, criando oportunidades para construtores de aplicativos.
  3. Escalar hardware não é o único caminho para o progresso da IA—inovações algorítmicas estão rapidamente reduzindo os custos.

O CEO da OpenAI, Sam Altman, até admitiu ao Reddit durante um AMA que a OpenAI provavelmente esteve “do lado errado da história” em relação aos esforços de código aberto—e que a empresa precisa descobrir uma nova estratégia. (No entanto, ele ressaltou que o código aberto não é a “maior prioridade” do laboratório no momento.)

No geral, a DeepSeek importa porque está injetando ainda mais urgência na corrida armamentista da IA. E, está injetando mais incerteza nessa corrida.

Governos em todo o mundo, notavelmente Irlanda e Itália, iniciaram investigações sobre a DeepSeek devido a preocupações com a segurança de dados. Centenas de empresas também correram para bloquear o acesso aos modelos da DeepSeek, temendo a influência do governo chinês e o tratamento incerto dos dados dos usuários.

Ao mesmo tempo, a OpenAI e a Microsoft estão supostamente investigando se a DeepSeek usou dados “destilados” dos modelos da OpenAI para treinar os seus. O czar da IA da Casa Branca, David Sacks, afirma que há “evidências substanciais” de que a DeepSeek usou ilegalmente os sistemas da OpenAI. (A DeepSeek não comentou diretamente sobre a acusação.)

Se essas alegações forem verdadeiras, isso levanta mais perguntas sobre os supostos marcos da empresa. Isso também deixa uma enorme interrogação sobre quão bem regulamentações e salvaguardas futuras resistirão, especialmente através das fronteiras internacionais.

Um Novo Normal

Em última análise, a grande mensagem é que a quebra de inovação da DeepSeek pode acelerar os grandes jogadores a lançarem ainda mais poderosas IA, levando a um novo normal onde lançamentos de IA acontecem ainda mais rapidamente.

“Eu espero que as pessoas se acostumem com os laboratórios chineses trazendo avanços e modelos, fazendo as coisas de maneira mais eficiente, e desafiando os laboratórios americanos a talvez lançarem novidades antes do que normalmente estariam prontos,” diz Roetzer.

Os investidores podem ter exagerado inicialmente, mas em cinco anos, poderemos ver a estreia da DeepSeek como um ponto de virada quando a concorrência se intensificou e os modelos de pesos abertos realmente atingiram o mainstream.

Diz Roetzer:

“Quando olharmos para trás, será um momento muito significativo.”



Bolt42