Por que todos na IA estão em pânico sobre o DeepSeek.

Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdos exclusivos sobre a cobertura líder da indústria em IA. Saiba mais

Alguns dias atrás, apenas os mais fãs de tecnologia (falo isso como um deles) haviam ouvido falar do DeepSeek, uma subsidiária de IA chinesa da igualmente evocativa High-Flyer Capital Management, uma empresa de análise quantitativa (ou quant) que foi lançada em 2015.

No entanto, nos últimos dias, a DeepSeek tem sido, sem dúvida, a empresa mais discutida no Vale do Silício. Isso se deve em grande parte ao lançamento do DeepSeek R1, um novo modelo de linguagem grande que realiza “raciocínio” semelhante ao modelo atualmente disponível da OpenAI, o o1 — levando vários segundos ou minutos para responder a perguntas difíceis e resolver problemas complexos enquanto reflete sobre sua própria análise em uma abordagem passo a passo, ou “cadeia de pensamento”.

Além disso, o DeepSeek R1 obteve pontuações iguais ou superiores ao o1 da OpenAI em uma variedade de benchmarks de terceiros (testes para medir o desempenho da IA na resposta a perguntas sobre vários temas) e foi, segundo fontes, treinado a uma fração do custo (reportadamente em torno de 5 milhões de dólares), com muito menos unidades de processamento gráfico (GPU) sob um embargo rigoroso imposto pelos EUA, onde a OpenAI está sediada.

Mas, ao contrário do o1, que está disponível apenas para assinantes pagantes do ChatGPT da categoria Plus (20 dólares por mês) e categorias mais caras (como Pro a 200 dólares por mês), o DeepSeek R1 foi lançado como um modelo completamente de código aberto, o que também explica por que ele rapidamente subiu no ranking da comunidade de compartilhamento de código de IA Hugging Face entre os modelos mais baixados e ativos.

Além disso, graças ao fato de ser totalmente de código aberto, as pessoas já afinaram e treinado várias variações do modelo para diferentes propósitos específicos, como torná-lo pequeno o suficiente para rodar em um dispositivo móvel ou combiná-lo com outros modelos de código aberto. Mesmo para fins de desenvolvimento, os custos da API do DeepSeek são mais de 90% mais baratos do que o modelo equivalente o1 da OpenAI.

O mais impressionante de tudo, você nem precisa ser um engenheiro de software para utilizá-lo: a DeepSeek tem um site gratuito e aplicativo móvel, até para usuários dos EUA, com uma interface de chatbot alimentada pelo R1 muito semelhante ao ChatGPT da OpenAI. Exceto que, mais uma vez, a DeepSeek “superou” a OpenAI ao conectar este poderoso modelo de raciocínio à busca na web — algo que a OpenAI ainda não fez (a busca na web está disponível apenas nos modelos da família GPT menos poderosos no momento).

Uma ironia aberta e fechada

Há uma ironia deliciosa, ou talvez desconcertante, nisso, dado os objetivos fundacionais da OpenAI de democratizar a IA para as massas. Como Jim Fan, Gerente Sênior de Pesquisa da NVIDIA, colocou no X: “Estamos vivendo em uma linha do tempo onde uma empresa não americana está mantendo a missão original da OpenAI viva – pesquisa de fronteira verdadeiramente aberta que empodera a todos. Não faz sentido. O resultado mais divertido é o mais provável.”

Ou como o usuário do X @SuspendedRobot comentou, referindo-se a relatórios que a DeepSeek parece ter sido treinada em respostas a perguntas e outros dados gerados pelo ChatGPT: “OpenAI roubou da internet toda para enriquecer a si mesma, a DeepSeek roubou deles e devolveu às massas de graça. Acho que há um certo folclore britânico sobre isso.”

Mas Fan não é o único a notar o sucesso da DeepSeek. A disponibilidade de código aberto do DeepSeek R1, seu alto desempenho e o fato de que aparentemente “surgiu do nada” para desafiar o antigo líder da IA generativa gerou ondas de choque em todo o Vale do Silício e além, com base nas minhas conversas e leituras de vários engenheiros, pensadores e líderes. Se não “todo mundo” está em parafuso com isso, como sugere meu título hiperbólico, certamente é o assunto do momento nos círculos de tecnologia e negócios.

Uma mensagem postada no Blind, o app para compartilhar fofocas anônimas no Vale do Silício, está circulando sugerindo que a Meta está em crise devido ao sucesso do DeepSeek, por como ele rapidamente superou os próprios esforços da Meta para ser o rei da IA de código aberto com seus modelos Llama.

‘Isso muda todo o jogo’

O usuário do X @tphuang escreveu de forma convincente: “A DeepSeek tornou a IA acessível fora do muito alto. Momento de iluminação para mim na 1ª foto. O R1 é tão mais barato que o custo da mão de obra dos EUA que muitos empregos serão automatizados nos próximos 5 anos,” observando posteriormente por que o R1 da DeepSeek é mais atraente para os usuários do que mesmo o o1 da OpenAI:

“3 grandes problemas com o o1:
1) muito lento
2) muito caro
3) falta de controle para o usuário final/dependência da OpenAI
O R1 resolve todos eles. Uma empresa pode comprar suas próprias GPUs da Nvidia, executar esses modelos. Não precisa se preocupar com custos adicionais ou servidores da OpenAI lentos/sem resposta.”

@tphaung também fez uma analogia convincente como uma pergunta: “A DeepSeek será para LLM o que o Android se tornou para o mundo dos sistemas operacionais?”

O empreendedor da web Arnaud Bertrand não poupou palavras sobre as implicações surpreendentes do sucesso da DeepSeek também, escrevendo no X: “Não há como exagerar o quanto isso muda todo o jogo. E não apenas em relação à IA, é também uma enorme crítica à tentativa equivocada dos EUA de impedir o desenvolvimento tecnológico da China, sem a qual a Deepseek pode não ter sido possível (como diz o ditado, a necessidade é a mãe das invenções).”

A questão da censura

No entanto, outros têm soado notas de cautela sobre a ascensão rápida da DeepSeek, argumentando que, como uma startup operando na China, está necessariamente sujeita às leis do país e aos requisitos de censura de conteúdo.

De fato, meu próprio uso da DeepSeek no aplicativo iOS aqui nos EUA descobriu que ele não respondeu perguntas sobre a Praça Tiananmen, local dos protestos pró-democracia de 1989 e repressões subsequentes pela polícia chinesa, resultando em pelo menos 200, possivelmente milhares de mortes, ganhando o apelido de “Massacre da Praça Tiananmen” em meios de comunicação ocidentais.

Ben Hylak, um ex-designer de interface humana da Apple e co-fundador da plataforma de análise de produtos de IA Dawn, postou no X como perguntar sobre esse assunto fez com que o DeepSeek R1 entrasse em um ciclo confuso.

Como membro da imprensa, eu, claro, levo a liberdade de expressão muito a sério e é, sem dúvida, uma das causas mais fundamentais que defendo.

No entanto, não posso deixar de notar que os modelos e produtos da OpenAI, incluindo o ChatGPT, também se recusam a responder a uma série inteira de perguntas sobre até conteúdo inócuo — especialmente em relação à sexualidade humana e a conteúdo erótico/adulto, NSFW.

Não é uma comparação exatamente igual, é claro. E haverá alguns que, por resistência à dependência de tecnologia estrangeira, se mostrarem céticos em relação ao valor e utilidade finais da DeepSeek. Mas não há como negar seu desempenho e baixo custo.

E em um momento em que 16,5% de todas as mercadorias dos EUA são importadas da China, é difícil para mim aconselhar contra o uso do DeepSeek R1 com base em preocupações de censura ou riscos de segurança — especialmente quando o código do modelo está livremente disponível para download, uso offline, utilização em ambientes seguros e para afinação à vontade.

Eu definitivamente detecto uma certa crise existencial sobre a “queda do Ocidente” e a “ascensão da China,” motivando algumas das discussões animadas em torno da DeepSeek, no entanto, e outros já conectaram isso a como usuários dos EUA ingressaram no aplicativo Xiaohongshu (também conhecido como “Pequeno Livro Vermelho”) quando o TikTok foi brevemente banido neste país, apenas para ficarem surpresos com a qualidade de vida na China retratada nos vídeos compartilhados lá. A chegada do DeepSeek R1 ocorre nesse contexto narrativo — um onde a China parece (e, por muitas métricas, é claramente) ascendente, enquanto os EUA parecem (e por muitas métricas, também estão) em declínio.

O primeiro, mas certamente não o último modelo de IA chinês a abalar o mundo

Ele também não será o último modelo de IA chinês a ameaçar a dominância dos gigantes do Vale do Silício — mesmo enquanto eles, como a OpenAI, levantam mais dinheiro do que nunca para suas ambições de desenvolver inteligência artificial geral (AGI), programas que superem os humanos na maior parte do trabalho economicamente valioso.

Ontem, outro modelo chinês da empresa mãe do TikTok, Bytedance — chamado Doubao-1.5-pro — foi lançado com desempenho equivalente ao modelo GPT-4o da OpenAI em benchmarks de terceiros, mas novamente, a 1/50 do custo.

Modelos chineses têm se tornado tão bons, tão rapidamente, que até mesmo aqueles fora da indústria de tecnologia estão notando: A revista The Economist recentemente publicou uma peça sobre o sucesso da DeepSeek e outros esforços de IA chineses, e o comentarista político Matt Bruenig postou no X que: “Eu tenho usado bastante o Gemini, ChatGPT e Claude para resumo de documentos do NLRB por quase um ano. A Deepseek é melhor que todos eles. A versão chatbot é gratuita. O preço para utilizar sua API é 99,5% abaixo do preço da API da OpenAI. [emoji de encolher os ombros]”

Como a OpenAI responde?

Não é surpresa que o co-fundador e CEO da OpenAI, Sam Altman, hoje disse que a empresa estava trazendo sua família de modelos de raciocínio ainda não lançada, o o3, para o ChatGPT, mesmo para usuários gratuitos. A OpenAI ainda parece estar traçando seu próprio caminho, com modelos mais proprietários e avançados — estabelecendo o padrão da indústria.

Mas a questão se torna: com a DeepSeek, ByteDance e outras empresas de IA chinesas pressionando seus calcanhares, por quanto tempo a OpenAI pode permanecer à frente na criação e lançamento de novos modelos de IA de ponta? E se ela cair, quão difícil e quão rápido será seu declínio?

A OpenAI tem outro precedente histórico a seu favor, no entanto. Se a DeepSeek e modelos chineses de IA se tornarem, de fato, para LLMs o que o Android se tornou para dispositivos móveis — levando a maior parte do mercado por um tempo — basta ver como o iPhone da Apple, com sua abordagem fechada, proprietária e interna, conseguiu se destacar na alta gama do mercado e expandir constantemente para baixo, especialmente nos EUA, a ponto de agora possuir quase 60% do mercado de smartphones domésticos.

Ainda assim, para todos aqueles que estão gastando grandes quantias para usar modelos de IA dos principais laboratórios, a DeepSeek mostra que as mesmas capacidades podem estar disponíveis por um custo muito menor e com muito mais controle. E em um cenário corporativo, isso pode ser suficiente para vencer o jogo.

Insights diários sobre casos de uso nos negócios com o VB Daily

Se você quer impressionar seu chefe, o VB Daily tem tudo o que você precisa. Nós te damos informações internas sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para o máximo ROI.

Leia nossa Política de Privacidade

Obrigado por se inscrever. Conheça mais boletins do VB aqui.

Ocorreu um erro.