Bolt42

A startup chinesa DeepSeek lançou uma versão atualizada de seu modelo de IA para raciocínio R1 na plataforma de desenvolvedores Hugging Face após anunciar a novidade em uma mensagem no WeChat na manhã de quarta-feira.

A versão atualizada do R1, que está sob uma licença MIT permissiva, permitindo seu uso comercial, é considerada uma “atualização menor”, de acordo com o anúncio da DeepSeek no WeChat. O repositório do Hugging Face não contém uma descrição do modelo — apenas arquivos de configuração e pesos, que são os componentes internos de um modelo que guiam seu comportamento.

Com 685 bilhões de parâmetros de tamanho, o R1 atualizado é bastante robusto. (“Parâmetros” é sinônimo de “pesos.”) Sem modificações, o modelo provavelmente não pode ser executado em hardware de consumo.

A DeepSeek ganhou destaque no início deste ano após o lançamento do R1, que desafiou modelos da OpenAI. A startup também gerou preocupações entre alguns reguladores nos EUA, que argumentam que a tecnologia da DeepSeek representa um risco à segurança nacional.


    vinte − 16 =

    Bolt42