O laboratório de IA chinês DeepSeek atualizou discretamente o Prover, seu modelo de IA projetado para resolver provas e teoremas matemáticos.
De acordo com o South China Morning Post, a DeepSeek carregou a versão mais recente do Prover, V2, junto com uma variante destilada na plataforma de desenvolvimento de IA Hugging Face na quarta-feira passada. Parece que ela foi construída sobre o modelo V3 da startup, que possui 671 bilhões de parâmetros e adota uma arquitetura de mistura de especialistas (MoE).
Os parâmetros correspondem, em termos gerais, às habilidades de resolução de problemas de um modelo, enquanto o MoE divide tarefas em subtarefas e as delega a componentes “especialistas” menores e especializados.
A DeepSeek atualizou o Prover pela última vez em agosto, descrevendo-o na época como um modelo de IA aberto e customizável para prova formal de teoremas e raciocínio matemático.
Em fevereiro, a Reuters informou que a DeepSeek estava considerando levantar fundos externos pela primeira vez. A empresa recentemente lançou uma versão atualizada do V3, um modelo de propósito geral, e espera-se que atualize seu modelo de “raciocínio” R1 em breve.
Conteúdo relacionado
Pinterest lança novas ferramentas para combater conteúdos gerados por IA de baixa qualidade
[the_ad id="145565"] O Pinterest anunciou finalmente que tomará medidas em relação à grande quantidade de conteúdo gerado por IA que tomou conta de sua plataforma. Após um…
Visa e Mastercard revelam compras com tecnologia de IA
[the_ad id="145565"] A inteligência artificial não está apenas infiltrando o mundo das startups. Agora, gigantes do cartão de crédito, como Visa e Mastercard, estão entrando no…
O chatbot Gemini do Google recebe ferramentas de criação de imagens aprimoradas.
[the_ad id="145565"] O aplicativo de chatbot Gemini do Google agora permite que você modifique tanto imagens geradas por IA quanto imagens enviadas do seu telefone ou…