A Mistral AI lança o Devstral, um novo modelo de agente de engenharia de software open source poderoso que roda em laptops.

Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre coberturas de IA líderes da indústria. Saiba mais

A bem financiada fabricante francesa de modelos de IA Mistral tem se destacado desde seu lançamento com um poderoso modelo de fundação open source no outono de 2023 — mas recebeu algumas críticas entre desenvolvedores na X recentemente por seu último lançamento de um modelo de linguagem grande (LLM) proprietário chamado Medium 3, que alguns interpretaram como uma traição às suas raízes open source e seu compromisso.

(Lembre-se de que modelos open source podem ser adaptados livremente por qualquer pessoa, enquanto modelos proprietários devem ser pagos e suas opções de personalização são mais limitadas e controladas pelo fabricante do modelo.)

Mas hoje, a Mistral está de volta e reafirmando seu compromisso com a comunidade de IA open source, especialmente no desenvolvimento de software alimentado por IA, de forma significativa. A empresa se uniu à startup open source All Hands AI, criadores do Open Devin, para lançar Devstral, um novo modelo de linguagem open source com 24 milhões de parâmetros — muito menor do que muitos concorrentes cujos modelos estão na casa dos bilhões, e, portanto, requerendo muito menos poder computacional, podendo ser executado em um laptop — projetado especificamente para o desenvolvimento de IA agente.

Ao contrário dos LLMs tradicionais projetados para conclusões de código de curto prazo ou geração de funções isoladas, o Devstral é otimizado para atuar como um agente completo de engenharia de software — capaz de entender o contexto entre arquivos, navegar por grandes bases de código e resolver problemas do mundo real.

O modelo já está disponível gratuitamente sob a licença permissiva Apache 2.0, permitindo que desenvolvedores e organizações o implantem, modifiquem e comercializem sem restrições.

“Queríamos lançar algo open para a comunidade de desenvolvedores e entusiastas — algo que eles pudessem executar localmente, de forma privada e modificar como quiserem,” disse Baptiste Rozière, cientista de pesquisa da Mistral AI. “Está liberado sob a Apache 2.0, então as pessoas podem fazer basicamente o que quiserem com isso.”

Construindo sobre o Codestral

Devstral representa o próximo passo no crescente portfólio de modelos focados em código da Mistral, após seu sucesso anterior com a série Codestral.

Lançado pela primeira vez em maio de 2024, o Codestral foi a primeira incursão da Mistral em LLMs especializados em codificação. Era um modelo de 22 bilhões de parâmetros treinado para lidar com mais de 80 linguagens de programação e se destacou por seu desempenho em tarefas de geração e conclusão de código.

A popularidade e as forças técnicas do modelo levaram a iterações rápidas, incluindo o lançamento do Codestral-Mamba — uma versão aprimorada baseada na arquitetura Mamba — e mais recentemente, o Codestral 25.01, que encontrou adoção entre desenvolvedores de plugins de IDE e usuários corporativos em busca de modelos de alta frequência e baixa latência.

O impulso em torno do Codestral ajudou a estabelecer a Mistral como um jogador chave no ecossistema de modelos de codificação e preparou o terreno para o desenvolvimento do Devstral — estendendo-se de rápidas conclusões para a execução de tarefas completas de agentes.

Supera modelos maiores em principais benchmarks de SWE

Devstral alcança uma pontuação de 46,8% no benchmark SWE-Bench Verified, um conjunto de dados de 500 problemas reais do GitHub manualmente validados quanto à correção.

Isso coloca o modelo à frente de todos os modelos open source já lançados e à frente de vários modelos fechados, incluindo o GPT-4.1-mini, que ele supera em mais de 20 pontos percentuais.

“Atualmente, é de longe o melhor modelo open para SWE-bench verified e para agentes de código,” disse Rozière. “E também é um modelo muito pequeno — apenas 24 bilhões de parâmetros — que você pode executar localmente, mesmo em um MacBook.”

“Compare o Devstral com modelos fechados e abertos avaliados sob qualquer estrutura — descobrimos que o Devstral alcança um desempenho substancialmente melhor do que vários alternativos de código fechado,” escreveu Sophia Yang, Ph.D., Chefe de Relações com Desenvolvedores da Mistral AI, na rede social X. “Por exemplo, o Devstral supera o recente GPT-4.1-mini em mais de 20%.”

O modelo é refinado a partir do Mistral Small 3.1 usando técnicas de aprendizado por reforço e alinhamento de segurança.

“Começamos com um modelo base muito bom com o controle de árvore pequena da Mistral, que já tem um bom desempenho,” disse Rozière. “Então, especializamos usando técnicas de segurança e aprendizado por reforço para melhorar seu desempenho no SWE-bench.”

Construído para a era agente

Devstral não é apenas um modelo de geração de código — ele é otimizado para integração em estruturas agenticas como OpenHands, SWE-Agent e OpenDevin.

Essas estruturas permitem que o Devstral interaja com casos de teste, navegue por arquivos fonte e execute tarefas complexas em projetos.

“Estamos lançando-o com o OpenDevin, que é uma estrutura para agentes de código,” disse Rozière. “Construímos o modelo, e eles constroem a estrutura — um conjunto de prompts e ferramentas que o modelo pode usar, como um backend para o modelo de desenvolvedor.”

Para garantir robustez, o modelo foi testado em diversos repositórios e fluxos de trabalho internos.

“Fomos muito cuidadosos para não superadaptar ao SWE-bench,” explicou Rozière. “Treinamos apenas em dados de repositórios que não foram clonados do conjunto do SWE-bench e validamos o modelo em diferentes estruturas.”

Ele acrescentou que a Mistral utilizou o Devstral internamente para assegurar que ele generaliza bem para novas tarefas não vistas.

Implantação eficiente com licença permissiva — mesmo para projetos corporativos e comerciais

A arquitetura compacta de 24 bilhões de parâmetros do Devstral torna prático para os desenvolvedores executá-lo localmente, seja em uma única GPU RTX 4090 ou em um Mac com 32GB de RAM. Isso o torna atraente para casos de uso sensíveis à privacidade e implantações em edge.

“Este modelo é direcionado a entusiastas e pessoas que se preocupam em executar algo localmente e de forma privada — algo que podem usar até em um avião sem internet,” disse Rozière.

Além de desempenho e portabilidade, sua licença Apache 2.0 oferece uma proposta atraente para aplicações comerciais. A licença permite uso, adaptação e distribuição sem restrições — mesmo para produtos proprietários — tornando o Devstral uma opção de baixa fricção para a adoção em empresas.

Especificações detalhadas e instruções de uso estão disponíveis no cartão do modelo Devstral-Small-2505 no Hugging Face.

O modelo possui uma janela de contexto de 128.000 tokens e usa o tokenizador Tekken com um vocabulário de 131.000.

Ele suporta implantação através de todas as principais plataformas open source, incluindo Hugging Face, Ollama, Kaggle, LM Studio e Unsloth, e funciona bem com bibliotecas como vLLM, Transformers e Mistral Inference.

Disponível via API ou localmente

O Devstral está acessível através da API Le Platforme da Mistral (interface de programação de aplicativos) sob o nome de modelo devstral-small-2505, com preços estabelecidos em $0,10 por milhão de tokens de entrada e $0,30 por milhão de tokens de saída.

Para quem está implantando localmente, o suporte para estruturas como OpenHands permite integração com bases de código e fluxos de trabalho agenticos diretamente.

Rozière compartilhou como ele incorpora o Devstral em seu próprio fluxo de desenvolvimento: “Eu uso pessoalmente. Você pode pedir para ele fazer pequenas tarefas, como atualizar a versão de um pacote ou modificar um script de tokenização. Ele encontra o lugar certo no seu código e faz as alterações. É realmente agradável de usar.”

Mais novidades a caminho

Enquanto o Devstral é atualmente lançado como uma prévia de pesquisa, a Mistral e a All Hands AI já estão trabalhando em um modelo maior de acompanhamento com capacidades expandidas. “Sempre haverá uma lacuna entre modelos menores e maiores,” observou Rozière, “mas já avançamos bastante para preencher isso. Esses modelos já apresentam um desempenho muito forte, mesmo em comparação com alguns competidores maiores.”

Com seus benchmarks de desempenho, licença permissiva e design agentico, o Devstral se posiciona não apenas como uma ferramenta de geração de código — mas como um modelo fundamental para a construção de sistemas autônomos de engenharia de software.

Insights diários sobre casos de uso empresarial com o VB Daily

Se você quer impressionar seu chefe, o VB Daily tem o que você precisa. Nós damos a você a informação privilegiada sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para o máximo ROI.

Leia nossa Política de Privacidade

Obrigado por se inscrever. Confira mais boletins do VB aqui.

Ocorreu um erro.