Bolt42

A startup de IA Mistral anunciou na quarta-feira um novo modelo de IA focado em programação: o Devstral.

O Devstral, que a Mistral afirma ter sido desenvolvido em parceria com a empresa de IA All Hands AI, está disponível publicamente sob a licença Apache 2.0, o que significa que pode ser utilizado comercialmente sem restrições. A Mistral alega que o Devstral supera outros modelos abertos como o Gemma 3 27B do Google e o V3 do laboratório de IA DeepSeek, no SWE-Bench Verified, um benchmark que avalia habilidades de codificação.

“O Devstral se destaca em utilizar ferramentas para explorar bases de código, editando múltiplos arquivos e ajudando a desenvolver agentes de engenharia de software,” escreve a Mistral em um post de blog enviado ao TechCrunch. “[Ele] opera sobre estruturas de agentes de código como OpenHands ou SWE-Agent, que definem a interface entre o modelo e os casos de teste […] O Devstral é leve o suficiente para ser executado em uma única [Nvidia] RTX 4090 ou em um Mac com 32GB de RAM, tornando-se uma escolha ideal para uso local e em dispositivos.”

Mistral Devstral
Resultados das avaliações de benchmark internas da Mistral sobre o DevstralCreditos da Imagem:Mistral

O Devstral chega em um momento em que assistentes de codificação baseados em IA, e os modelos que os sustentam, estão se tornando cada vez mais populares. No mês passado, a JetBrains, empresa por trás de uma série de ferramentas populares de desenvolvimento de aplicativos, lançou seu primeiro modelo de IA “aberto” para codificação. Nos últimos meses, empresas de IA, incluindo Google, Windsurf e OpenAI, também revelaram modelos, tanto disponíveis publicamente quanto proprietários, otimizados para tarefas de programação.

Modelos de IA ainda enfrentam dificuldades para codificar softwares de qualidade — a IA que gera código tende a introduzir vulnerabilidades de segurança e erros, devido a fraquezas em áreas como a compreensão da lógica de programação. No entanto, sua promessa de aumentar a produtividade de codificação está levando empresas — e desenvolvedores — a adotá-los rapidamente. Uma recente pesquisa revelou que 76% dos desenvolvedores usaram ou planejavam usar ferramentas de IA em seus processos de desenvolvimento no ano passado.

A Mistral anteriormente se envolveu no espaço de programação assistiva com o Codestral, um modelo generativo para código. Mas o Codestral não foi lançado sob uma licença que permitisse que desenvolvedores usassem o modelo em aplicações comerciais; sua licença proibia explicitamente “qualquer uso interno por funcionários no contexto das atividades empresariais [de uma] empresa.”

O Devstral, que a Mistral está chamando de “prévia de pesquisa”, pode ser baixado de plataformas de desenvolvimento de IA, incluindo Hugging Face, e também acessado através da API da Mistral. Seu preço é de $0,1 por milhão de tokens de entrada e $0,3 por milhão de tokens de saída, sendo os tokens os dados brutos que os modelos de IA utilizam. (Um milhão de tokens equivale a cerca de 750.000 palavras, ou aproximadamente 163.000 palavras a mais do que “Guerra e Paz.”)

A Mistral afirma que está “trabalhando ativamente na construção de um modelo de codificação mais abrangente, que estará disponível nas próximas semanas.” O Devstral não é um modelo pequeno em si, mas é relativamente menor com 24 bilhões de parâmetros. (Os parâmetros correspondem, em geral, às habilidades de resolução de problemas de um modelo, e modelos com mais parâmetros tendem a ter um desempenho melhor do que aqueles com menos parâmetros.)

A Mistral, fundada em 2023, é um laboratório de modelos de ponta, com o objetivo de construir uma variedade de serviços movidos por IA, incluindo uma plataforma de chatbot, Le Chat, e aplicativos móveis. É apoiada por investidores de capital de risco, incluindo a General Catalyst, e já levantou mais de €1,1 bilhão (cerca de $1,24 bilhão) até o momento. Os clientes da Mistral incluem o BNP Paribas, AXA e Mirakl.

O Devstral é o terceiro lançamento de produto da Mistral neste mês. Há algumas semanas, a Mistral lançou o Mistral Medium 3, um modelo de uso geral eficiente. Quase ao mesmo tempo, a empresa lançou o Le Chat Enterprise, um serviço de chatbot voltado para empresas que oferece ferramentas como um construtor de “agentes” de IA e integra os modelos da Mistral com serviços de terceiros como Gmail, Google Drive e SharePoint.


    cinco + dez =

    Bolt42