Participe do evento confiável por líderes empresariais há quase duas décadas. O VB Transform reúne as pessoas que estão construindo uma verdadeira estratégia de IA empresarial. Saiba mais
Mistral AI, a startup francesa de inteligência artificial, anunciou na quarta-feira uma ampla expansão em infraestrutura de IA que posiciona a empresa como a resposta da Europa aos gigantes da computação em nuvem americanos, revelando simultaneamente novos modelos de raciocínio que rivalizam com os sistemas mais avançados da OpenAI.
A empresa com sede em Paris revelou Mistral Compute, uma plataforma abrangente de infraestrutura de IA desenvolvida em parceria com Nvidia, projetada para oferecer às empresas e governos europeus uma alternativa ao fornecimento de nuvens baseados nos EUA, como Amazon Web Services, Microsoft Azure e Google Cloud. Essa mudança representa um desvio estratégico significativo para a Mistral, passando de um desenvolvimento puramente de modelos de IA para controle de toda a pilha tecnológica.
“Essa mudança para infraestrutura de IA marca um passo transformador para a Mistral AI, pois nos permite abordar um vertical crítico da cadeia de valor da IA,” disse Arthur Mensch, CEO e cofundador da Mistral AI. “Com essa mudança vem a responsabilidade de garantir que nossas soluções não apenas promovam inovação e adoção de IA, mas também sustentem a autonomia tecnológica da Europa e contribuam para sua liderança em sustentabilidade.”
Como a Mistral construiu modelos de raciocínio que pensam em qualquer idioma
Juntamente com o anúncio da infraestrutura, a Mistral revelou sua série de modelos de raciocínio Magistral — sistemas de IA capazes de pensar logicamente passo a passo, semelhante ao modelo o1 da OpenAI e ao DeepSeek R1 da China. Mas Guillaume Lample, cientista chefe da Mistral, afirma que a abordagem da empresa difere dos concorrentes de maneiras cruciais.
“Fizemos tudo do zero, basicamente porque queríamos aprender a expertise que temos, como flexibilidade no que fazemos,” Lample me disse em uma entrevista exclusiva. “Conseguimos ser, como, realmente muito eficientes na pipeline mais forte de aprendizado por reforço online.”
Ao contrário dos concorrentes que frequentemente ocultam seus processos de raciocínio, os modelos da Mistral mostram toda a sua cadeia de pensamento aos usuários — e, crucialmente, na língua nativa do usuário, em vez de default para o inglês. “Aqui temos toda a cadeia de pensamento que é apresentada ao usuário, mas em seu próprio idioma, para que possam lê-la, ver se faz sentido,” explicou Lample.
A empresa lançou duas versões: Magistral Small, um modelo open-source de 24 bilhões de parâmetros, e Magistral Medium, um sistema proprietário mais poderoso disponível através da API da Mistral.
Por que os modelos de IA da Mistral ganharam superpoderes inesperados durante o treinamento
Os modelos demonstraram capacidades surpreendentes que surgiram durante o treinamento. Mais notavelmente, o Magistral Medium manteve habilidades de raciocínio multimodal — a capacidade de analisar imagens — mesmo que o processo de treinamento tenha se concentrado apenas em problemas matemáticos e de codificação baseados em texto.
“Algo que percebemos, não exatamente por engano, mas algo que não esperávamos, é que se no final do treinamento de aprendizado por reforço você conectar de volta o encoder de visão inicial, então de repente, meio que do nada, vemos o modelo sendo capaz de fazer raciocínio sobre imagens,” disse Lample.
Os modelos também adquiriram habilidades sofisticadas de chamada de função, realizando automaticamente buscas na internet e execução de código para responder a consultas complexas. “O que você verá é um modelo fazendo isso, pensando, então percebendo, ok, essa informação pode estar desatualizada. Deixe-me fazer uma busca na web,” explicou Lample. “Ele irá buscar na internet e, em seguida, irá processar os resultados, e dirá, talvez, talvez a resposta não esteja nesses resultados. Deixe-me buscar novamente.”
Esse comportamento surgiu naturalmente, sem treinamento específico. “É algo que, seja ou não sobre o que fazer a seguir, encontramos que na verdade acontece de maneira bastante natural. Então foi uma grata surpresa para nós,” observou Lample.
A inovação de engenharia que torna o treinamento da Mistral mais rápido que os concorrentes
A equipe técnica da Mistral superou desafios de engenharia significativos para criar o que Lample descreve como uma inovação em infraestrutura de treinamento. A empresa desenvolveu um sistema para “aprendizado por reforço online” que permite que modelos de IA melhorem continuamente enquanto geram respostas, em vez de depender de dados de treinamento pré-existentes.
A inovação chave envolveu sincronizar atualizações de modelos em centenas de unidades de processamento gráfico (GPUs) em tempo real. “O que fizemos foi encontrar uma maneira de apenas descarregar o modelo através de GPUs. Quero dizer, de GPU para GPU,” explicou Lample. Isso permite que o sistema atualize pesos do modelo em diferentes clusters de GPU em segundos, em vez das horas normalmente necessárias.
O processo de treinamento provou ser muito mais rápido e mais barato que o pré-treinamento tradicional. “Foi muito mais barato que o pré-treinamento regular. O pré-treinamento é algo que levaria semanas ou meses em outras GPUs. Aqui, estamos em um nível muito abaixo disso. Depende de quantas pessoas colocamos nisso. Mas foi mais como, foi muito menos de uma semana,” disse Lample.
A Nvidia compromete 18.000 chips para a independência da IA da Europa
A plataforma Mistral Compute funcionará em 18.000 dos mais novos chips Grace Blackwell da Nvidia, inicialmente hospedados em um data center em Essonne, França, com planos de expansão por toda a Europa. O CEO da Nvidia, Jensen Huang, descreveu a parceria como crucial para a independência tecnológica da Europa.
“Cada país deve construir IA para sua própria nação, em sua própria nação,” disse Huang em um anúncio conjunto em Paris. “Com a Mistral AI, estamos desenvolvendo modelos e fábricas de IA que servem como plataformas soberanas para empresas na Europa escalarem inteligência em diversos setores.”
Huang projetou que a capacidade de computação em IA da Europa aumentaria dez vezes nos próximos dois anos, com mais de 20 “fábricas de IA” planejadas por todo o continente. Várias dessas instalações terão mais de um gigawatt de capacidade, potencialmente posicionando-se entre os maiores data centers do mundo.
A parceria vai além da infraestrutura, incluindo o trabalho da Nvidia com outras empresas de IA europeias e a Perplexity, a empresa de busca, para desenvolver modelos de raciocínio em vários idiomas europeus onde os dados de treinamento são frequentemente limitados.
Como a Mistral planeja resolver os problemas ambientais e de soberania da IA
Mistral Compute aborda duas grandes preocupações sobre o desenvolvimento de IA: impacto ambiental e soberania de dados. A plataforma assegura que os clientes europeus possam manter suas informações dentro das fronteiras da UE e sob jurisdição europeia.
A empresa se associou à agência nacional da França para a transição ecológica e à Carbone 4, uma consultoria em clima de ponta, para avaliar e minimizar a pegada de carbono de seus modelos de IA ao longo de seu ciclo de vida. A Mistral planeja alimentar seus data centers com fontes de energia descarbonizadas.
“Ao escolher a Europa como local de nossas instalações, damos a nós mesmos a capacidade de nos beneficiar de fontes de energia amplamente descarbonizadas,” afirmou a empresa em seu anúncio.
A vantagem de velocidade dá aos modelos de raciocínio da Mistral uma vantagem prática
Testes iniciais sugerem que os modelos de raciocínio da Mistral oferecem desempenho competitivo enquanto abordam uma crítica comum aos sistemas existentes — velocidade. Modelos de raciocínio atuais da OpenAI e de outros podem levar minutos para responder a consultas complexas, limitando sua utilidade prática.
“Uma das coisas que as pessoas geralmente não gostam sobre esse modelo de raciocínio é que, embora seja inteligente, às vezes leva muito tempo,” observou Lample. “Aqui você realmente vê a saída em apenas alguns segundos, às vezes menos de cinco segundos, às vezes até menos. E isso muda a experiência.”
A vantagem de velocidade pode se mostrar crucial para a adoção empresarial, onde esperar minutos por respostas da IA cria gargalos nos fluxos de trabalho.
O que a aposta da Mistral em infraestrutura significa para a competição global em IA
A mudança da Mistral para infraestrutura a coloca em concorrência direta com gigantes tecnológicos que dominaram o mercado de computação em nuvem. Amazon Web Services, Microsoft Azure e Google Cloud controlam atualmente a maior parte da infraestrutura de nuvem global, enquanto jogadores mais novos como CoreWeave ganharam terreno especificamente em cargas de trabalho de IA.
A abordagem da empresa difere dos concorrentes ao oferecer uma solução completa e verticalmente integrada — do hardware à infraestrutura, passando por modelos de IA até serviços de software. Isso inclui Mistral AI Studio para desenvolvedores, Le Chat para produtividade empresarial e Mistral Code para assistência em programação.
Analistas da indústria veem a estratégia da Mistral como parte de uma tendência mais ampla em direção ao desenvolvimento regional de IA. “A Europa precisa urgentemente aumentar sua infraestrutura de IA se quiser permanecer competitiva globalmente,” observou Huang, ecoando preocupações expressas por formuladores de políticas europeus.
O anúncio ocorre em um momento em que os governos europeus estão cada vez mais preocupados com sua dependência de empresas de tecnologia americanas para infraestrutura crítica de IA. A União Europeia comprometeu 20 bilhões de euros para construir “gigafábricas” de IA por todo o continente, e a parceria da Mistral com a Nvidia pode ajudar a acelerar esses planos.
A dupla anúncio da Mistral sobre infraestrutura e capacidades de modelos sinaliza a ambição da empresa de se tornar uma plataforma de IA abrangente, e não apenas mais um fornecedor de modelos. Com o apoio da Microsoft e de outros investidores, a empresa levantou mais de 1 bilhão de dólares e continua buscando financiamento adicional para apoiar seu escopo expandido.
Mas Lample vê possibilidades ainda maiores à frente para os modelos de raciocínio. “Quando olho para o progresso internamente, e penso em alguns benchmarks, o modelo estava melhorando cerca de 5% de precisão a cada semana por cerca de seis semanas,” disse ele. “Então está melhorando muito rápido, há uma tonelada de ideias que você pode pensar que melhorarão o desempenho.”
O sucesso deste desafio europeu à dominância americana em IA pode, em última análise, depender de os clientes valorizarem a soberania e a sustentabilidade o suficiente para mudar de fornecedores estabelecidos. Por enquanto, pelo menos, eles têm uma escolha.
Insights diários sobre casos de uso empresarial com o VB Daily
Se você quiser impressionar seu chefe, o VB Daily tem tudo coberto. Nós te damos informações internas sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights para um ROI máximo.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais newsletters do VB aqui.
Ocorreu um erro.

Conteúdo relacionado
Os modelos de raciocínio realmente pensam ou não? Pesquisa da Apple gera um debate acalorado.
[the_ad id="145565"] Participe do evento confiável pelos líderes empresariais há quase duas décadas. O VB Transform reúne pessoas que constroem uma verdadeira estratégia de IA…
Além da arquitetura GPT: Por que a abordagem de Difusão do Google pode redefinir a implementação de LLMs
[the_ad id="145565"] Participe do evento confiável por líderes empresariais há quase duas décadas. O VB Transform reúne pessoas que estão construindo uma verdadeira estratégia…
O Ato RISE do Senador exigiria que desenvolvedores de IA listassem dados de treinamento e métodos de avaliação em troca de ‘porto seguro’ contra processos judiciais.
[the_ad id="145565"] Participe do evento confiável por líderes empresariais há quase duas décadas. O VB Transform reúne as pessoas que estão construindo uma verdadeira…