Bolt42

A empresa de inteligência artificial DeepSeek está sendo vista como a resposta da China ao OpenAI—aparentemente causando desordem no Vale do Silício e em Wall Street, resultando na perda de $600 bilhões no valor de mercado da Nvidia em um único dia.

No entanto, enquanto alguns retratam a DeepSeek como um gigante da IA pronto para revolucionar a indústria, a realidade sobre suas capacidades—e as verdadeiras dinâmicas competitivas—é bem menos dramática, de acordo com fontes.

A seguir, uma análise mais aprofundada das maiores alegações sobre a DeepSeek—e por que os especialistas dizem que não se sustentam.

Alegação: A DeepSeek é muito mais barata do que outros modelos

Grande parte da cobertura entusiasta se concentrou nos custos mais baixos da DeepSeek.

A DeepSeek lançou recentemente seu modelo R1 de código aberto, supostamente a uma fração do custo de treinamento—apesar de estar limitada pela falta de acesso aos chips de IA mais avançados da Nvidia, devido a políticas dos EUA destinadas a desacelerar o progresso da China. Em dezembro, a empresa afirmou que seu modelo V3 custou apenas $6 milhões para ser treinado, um valor assustadoramente baixo em comparação aos mais de $100 milhões que a OpenAI gastou no GPT-4.

Os custos de treinamento podem ser mais baixos do que os dos EUA, mas os custos reais começam a se acumular quando os modelos estão em execução em larga escala.

“Embora o treinamento possa ser mais barato, isso realmente não muda o jogo,” disse Jason Snyder, CTO da Momentum Worldwide, explicando que o maior custo na IA não é o treinamento do modelo, mas os custos contínuos de execução em larga escala—também conhecidos como inferência. Empresas como OpenAI e Meta gastam bilhões operando seus modelos, um custo que a DeepSeek também enfrentará eventualmente.

Sem acesso aos GPUs de alto nível da Nvidia, a DeepSeek conta com alternativas locais, como as da Huawei, que ajudam a reduzir os custos de treinamento, apontou Snyder.

Alegação: R1 é tão poderoso quanto o GPT-4

Apesar do entusiasmo, a DeepSeek não fez um grande avanço em inovação.

O modelo foi otimizado para um desempenho aceitável, de acordo com Snyder, e não para resultados de ponta.

Embora o desempenho do R1 seja impressionante, ele não chega a igualar as capacidades do GPT-4. Segundo Snyder, o modelo da DeepSeek está mais alinhado com o GPT-3.5, e não com os avançados modelos GPT-4 turbo ou Gemini 1.5.

“Como é de código aberto, as pessoas assumem que é uma versão gratuita do GPT-4,” disse Snyder. “É bom, mas não é um divisor de águas.”

Alegação: EUA perdem sua supremacia em IA para a China

Não apenas pelos motivos acima, mas enquanto o R1 pode ter um bom desempenho em certos benchmarks, isso não sinaliza uma perda da supremacia em IA dos EUA.

De acordo com Snyder, os EUA lideram em pesquisa de ponta, implantação de modelos e adoção empresarial. A China, apesar de ter feito avanços, ainda está atrás quando se trata de IA de fronteira (os modelos de IA mais avançados) e AGI (inteligência geral artificial).

“A China está apostando na adoção de código aberto para fechar a lacuna, mas ainda não assumiu a liderança,” disse Snyder.

Zack Kass, consultor em IA e ex-líder de mercado da OpenAI, explica que possuir tecnologia de fronteira é apenas parte da equação. “É a adoção da tecnologia que, em última análise, define o sucesso econômico,” disse ele, apontando para a rápida implantação do ChatGPT pela OpenAI como um exemplo primário.

Alegação: DeepSeek nivela o campo da IA

muitos estão exaltando o modelo de código aberto da DeepSeek como uma força democratizadora na IA, alegando que nivela o campo de jogo. Mas, segundo os especialistas, a realidade é mais complexa.

Embora a IA de código aberto abra portas para startups e pequenas empresas, (certamente, podemos ver algumas empresas desafiantes emocionantes surgindo com maneiras de usar a IA gerativa que não pensamos antes), ela faz pouco para mudar o poder das grandes empresas de tecnologia.

A competição em IA é impulsionada não apenas pelo acesso a modelos, mas por poder computacional, dados e redes de distribuição—ativos que empresas como Microsoft e Amazon controlam em abundância.

“A verdadeira vantagem competitiva ainda pertence a empresas como a Microsoft e a Amazon, que controlam enormes conjuntos de dados para ajustes finos, métodos de aprendizado por reforço proprietários e canais de distribuição,” disse Snyder.

Alegação: R1 representa riscos à segurança nacional

Há uma pressa em rotular o R1 da DeepSeek como uma ameaça à segurança nacional, com temores de que seja armado pelo governo chinês.

Mas os especialistas alertam que a verdadeira preocupação reside no aplicativo que a DeepSeek criou, e não no modelo em si, (a DeepSeek destronou o ChatGPT na App Store da Apple nos EUA na semana passada).

“O próprio aplicativo pode ser um atrativo para consumidores ocidentais,” disse Kass, traçando comparações com aplicativos chineses como o TikTok, que levantaram alarmes de segurança nacional no passado.

Mas o R1 pode existir independentemente do aplicativo, e empresas (Perplexity disponibilizaram o R1 para ajudar os usuários premium com pesquisas no deep web) podem usar os modelos para seus próprios fins.

Bolt42