A próxima fronteira para modelos de linguagem de grande escala (LLMs), uma das principais tecnologias que fundamentam o crescimento de ferramentas de IA generativa, pode estar relacionada à geografia. Na segunda-feira, a startup de IA com sede em Paris, Mistral — que busca rivalizar com empresas como Anthropic e OpenAI, baseadas nos EUA — lançará um modelo que é um pouco diferente de seu LLM habitual.
Nomeado Mistral Saba, o novo modelo treinado especificamente é projetado para atender a uma geografia específica: países de fala árabe. O objetivo do Mistral Saba é se destacar em interações em árabe.
Mistral Saba é um modelo relativamente pequeno com 24 bilhões de parâmetros. Vale lembrar que menos parâmetros geralmente levam a um melhor desempenho com menor latência. No entanto, mais parâmetros costumam significar respostas mais inteligentes, mesmo que não haja uma correlação linear.
O Mistral Saba é comparável em tamanho ao Mistral Small 3, seu modelo pequeno de uso geral. Mas, de acordo com os próprios testes da Mistral, o Mistral Saba tem um desempenho muito melhor ao lidar com conteúdo em árabe.
Como um efeito colateral interessante, devido à troca cultural entre o Oriente Médio e o Sul da Ásia, Saba também funciona bem com línguas de origem indiana, segundo a Mistral — especialmente línguas de origem no sul da Índia, como Tamil e Malayalam.

O novo modelo representa um movimento estratégico interessante para o gigante francês da IA, mostrando um foco crescente no Oriente Médio. A Mistral afirmou que espera que o modelo a ajude a ganhar tração entre os clientes na região.
Como um modelo pronto para uso, o Mistral Saba pode ser utilizado para suporte conversacional ou geração de conteúdo em árabe que soe mais natural e relevante. Ele também pode ser usado como base para alguns modelos ajustados para casos de uso internos, segundo a empresa.
Na semana passada, a Mistral usou a Cúpula de Ação de IA para demonstrar que está levando o negócio a sério. Embora a empresa já tenha arrecadado grandes quantias de dinheiro de investidores internacionais, muitos de seus apoiadores estrangeiros estão baseados nos EUA — investidores como Lightspeed Venture Partners, Andreessen Horowitz e Salesforce Ventures.
Devido ao cenário geopolítico em mudança, a Mistral pode potencialmente acolher investidores do Oriente Médio em sua próxima rodada de financiamento. Isso seria uma maneira de arrecadar mais dinheiro para se manter relevante na corrida da IA em um nível técnico, enquanto se posiciona como uma alternativa internacional às empresas de IA dos EUA e da China. O modelo mais recente da Mistral, Saba, poderia, portanto, contribuir para esse esforço de captação de recursos potencial.
O Mistral Saba está acessível através da API da Mistral. Ele também pode ser implantado localmente, o que poderia ser um forte ponto de venda para empresas que atuam em setores sensíveis, como energia, finanças ou saúde.
Devido às raízes europeias da empresa, desde o lançamento do modelo original de pesos abertos Mistral 7B, ela tem reiterado que leva a sério o suporte a múltiplas línguas. O lançamento do Saba é uma continuação dessa posição. E a Mistral afirmou que vai direcionar sua atenção a outras línguas regionais no futuro.
Conteúdo relacionado
Runway, conhecida por seus modelos de IA para geração de vídeo, arrecada R$ 308 milhões.
[the_ad id="145565"] Runway, uma startup que desenvolve uma variedade de modelos de IA generativa para a produção de mídia, incluindo modelos de geração de vídeo, levantou US$…
Plataforma de IA de Voz Phonic recebe apoio da Lux
[the_ad id="145565"] A qualidade das vozes geradas por IA é suficientemente boa para criar audiolivros e podcasts, ler artigos em voz alta e oferecer suporte ao cliente básico.…
Como Claude Pensa? A Busca da Anthropic para Desvendar a Caixa-preta da IA
[the_ad id="145565"] Modelos de linguagem de grande escala (LLMs) como Claude mudaram a maneira como usamos a tecnologia. Eles alimentam ferramentas como chatbots, ajudam a…