A startup chinesa DeepSeek lançou uma versão atualizada de seu modelo de IA para raciocínio R1 na plataforma de desenvolvedores Hugging Face após anunciar a novidade em uma mensagem no WeChat na manhã de quarta-feira.
A versão atualizada do R1, que está sob uma licença MIT permissiva, permitindo seu uso comercial, é considerada uma “atualização menor”, de acordo com o anúncio da DeepSeek no WeChat. O repositório do Hugging Face não contém uma descrição do modelo — apenas arquivos de configuração e pesos, que são os componentes internos de um modelo que guiam seu comportamento.
Com 685 bilhões de parâmetros de tamanho, o R1 atualizado é bastante robusto. (“Parâmetros” é sinônimo de “pesos.”) Sem modificações, o modelo provavelmente não pode ser executado em hardware de consumo.
A DeepSeek ganhou destaque no início deste ano após o lançamento do R1, que desafiou modelos da OpenAI. A startup também gerou preocupações entre alguns reguladores nos EUA, que argumentam que a tecnologia da DeepSeek representa um risco à segurança nacional.
Conteúdo relacionado
Descoberta da Microsoft: Como Agentes de IA Estão Acelerando Descobertas Científicas
[the_ad id="145565"] A pesquisa científica tem sido tradicionalmente um processo lento e cuidadoso. Cientistas passam anos testando ideias e realizando experimentos. Eles leem…
FLUX.1 Kontext permite a geração de imagens em contexto para pipelines de IA empresarial.
[the_ad id="145565"] Participe de nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de ponta. Saiba Mais…
Elon se afasta do DOGE e o Vale do Silício entra na fase de ‘descoberta’
[the_ad id="145565"] Elon Musk anunciou oficialmente que está se afastando como um funcionário especial do governo dos EUA e o chefe de fato do Departamento de Eficiência…