Bolt42

O laboratório de IA chinês DeepSeek atualizou discretamente o Prover, seu modelo de IA projetado para resolver provas e teoremas matemáticos.

De acordo com o South China Morning Post, a DeepSeek carregou a versão mais recente do Prover, V2, junto com uma variante destilada na plataforma de desenvolvimento de IA Hugging Face na quarta-feira passada. Parece que ela foi construída sobre o modelo V3 da startup, que possui 671 bilhões de parâmetros e adota uma arquitetura de mistura de especialistas (MoE).

Os parâmetros correspondem, em termos gerais, às habilidades de resolução de problemas de um modelo, enquanto o MoE divide tarefas em subtarefas e as delega a componentes “especialistas” menores e especializados.

A DeepSeek atualizou o Prover pela última vez em agosto, descrevendo-o na época como um modelo de IA aberto e customizável para prova formal de teoremas e raciocínio matemático.

Em fevereiro, a Reuters informou que a DeepSeek estava considerando levantar fundos externos pela primeira vez. A empresa recentemente lançou uma versão atualizada do V3, um modelo de propósito geral, e espera-se que atualize seu modelo de “raciocínio” R1 em breve.


    6 + seis =

    Bolt42