Bolt42

Desde que a empresa chinesa de IA DeepSeek lançou uma versão open-source de seu modelo de raciocínio R1 no início desta semana, muitos no setor de tecnologia têm feito declarações grandiosas sobre o que a empresa alcançou e o que isso significa para o estado da IA.

O capitalista de risco Marc Andreessen, por exemplo, publicou que a DeepSeek é “um dos breakthroughs mais incríveis e impressionantes que já vi.”

O R1 aparentemente iguala ou supera o modelo o1 da OpenAI em certos benchmarks de IA. Além disso, a empresa afirma que um de seus modelos custou apenas 5,6 milhões de dólares para treinar, em comparação com as centenas de milhões de dólares que as principais empresas americanas pagam para treinar os seus.

Ela também parece ter alcançado isso diante das sanções dos EUA que proíbem a venda de chips avançados para empresas chinesas. O MIT Technology Review escreve que o sucesso da empresa ilustra como as sanções estão “levando startups como a DeepSeek a inovar de maneiras que priorizam eficiência, compartilhamento de recursos e colaboração.” (Por outro lado, o Wall Street Journal relata que Liang Wenfeng, da DeepSeek, afirmou recentemente ao primeiro-ministro da China que as restrições de exportação americanas ainda representam um gargalo.)

O CEO da Curai, Neal Khosla, ofereceu uma explicação mais simples, afirmando que a empresa é um “psicopata do estado ccp” que está “fingindo que o custo era baixo para justificar um preço baixo e esperando que todos mudem para isso [para] prejudicar a competitividade da IA nos EUA.” (Uma Nota da Comunidade foi anexada ao seu post apontando que Khosla não apresenta evidências para isso, e que seu pai, Vinod, é um investidor da OpenAI.)

Enquanto isso, o jornalista Holger Zschaepitz sugeriu que a DeepSeek poderia “representar a maior ameaça aos mercados de ações dos EUA” — se uma empresa chinesa consegue construir um modelo de ponta a baixo custo, sem acesso a chips avançados, isso colocaria em dúvida “a utilidade dos bilhões de dólares que estão sendo investidos nesta indústria.”

Em resposta, o CEO da Y Combinator, Garry Tan, argumentou que o sucesso da DeepSeek seria, na verdade, benéfico para seus concorrentes americanos: “Se o treinamento de modelos se tornar mais barato, mais rápido e mais fácil, a demanda por inferência (uso real da IA) crescerá e acelerará ainda mais, o que garante que o fornecimento de computação será utilizado.”

E o Cientista Chefe de IA da Meta, Yann LeCun, argumentou contra ver o anúncio da DeepSeek na perspectiva de China versus Estados Unidos. Em vez disso, ele sugeriu que a verdadeira lição é que “modelos open source estão superando os proprietários.”

“A DeepSeek se beneficiou de pesquisas abertas e open source (por exemplo, PyTorch e Llama da Meta),” escreveu LeCun. “Eles elaboraram novas ideias e as construíram sobre o trabalho de outras pessoas. Como seu trabalho é publicado e open source, todos podem se beneficiar dele.”

Todo o debate parece estar incentivando os consumidores a experimentar o produto — até domingo à tarde, o assistente de IA da DeepSeek é o aplicativo gratuito mais bem classificado na App Store da Apple, logo à frente do ChatGPT.


    quinze − 8 =

    Bolt42