O laboratório de IA chinês DeepSeek atualizou discretamente o Prover, seu modelo de IA projetado para resolver provas e teoremas matemáticos.
De acordo com o South China Morning Post, a DeepSeek carregou a versão mais recente do Prover, V2, junto com uma variante destilada na plataforma de desenvolvimento de IA Hugging Face na quarta-feira passada. Parece que ela foi construída sobre o modelo V3 da startup, que possui 671 bilhões de parâmetros e adota uma arquitetura de mistura de especialistas (MoE).
Os parâmetros correspondem, em termos gerais, às habilidades de resolução de problemas de um modelo, enquanto o MoE divide tarefas em subtarefas e as delega a componentes “especialistas” menores e especializados.
A DeepSeek atualizou o Prover pela última vez em agosto, descrevendo-o na época como um modelo de IA aberto e customizável para prova formal de teoremas e raciocínio matemático.
Em fevereiro, a Reuters informou que a DeepSeek estava considerando levantar fundos externos pela primeira vez. A empresa recentemente lançou uma versão atualizada do V3, um modelo de propósito geral, e espera-se que atualize seu modelo de “raciocínio” R1 em breve.
Conteúdo relacionado
Quebrando o ‘gargalo intelectual’: Como a IA está computando o anteriormente incomputável na saúde.
[the_ad id="145565"] Sure! Here is your content rewritten in Portuguese while keeping the HTML tags intact: Junte-se aos nossos boletins diários e semanais para receber as…
OpenAI explica por que o ChatGPT se tornou excessivamente bajulador
[the_ad id="145565"] A OpenAI publicou um postmortem sobre os recentes problemas de bajulação com o modelo padrão que alimenta o ChatGPT, o GPT-4o — questões que forçaram a…
Structify capta R$ 4,1 milhões em seed para transformar dados não estruturados da web em conjuntos de dados prontos para empresas.
[the_ad id="145565"] Inscreva-se em nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA líder do setor. Saiba mais…