Bolt42

A Microsoft está entrando no jogo de construção de modelos de IA.

De acordo com The Information, o gigante da tecnologia está desenvolvendo um novo modelo de linguagem grande, internamente chamado de “MAI-1”, que pode competir com ofertas de Google, Anthropic e até OpenAI—apesar da parceria bilionária da Microsoft com este último.

O modelo, que tem cerca de 500 bilhões de parâmetros, está sob a supervisão de Mustafa Suleyman. Suleyman foi anteriormente CEO da startup de IA Inflection, que a Microsoft praticamente adquiriu alguns meses atrás em um negócio de 650 milhões de dólares. Embora o MAI-1 seja descrito como um modelo totalmente novo, ele pode aproveitar os dados de treinamento e tecnologias da Inflection.

Por que a Microsoft está buscando seu próprio modelo de fronteira quando já possui um acordo com a OpenAI?

É tudo sobre explorar todas as possibilidades no espaço dinâmico da IA, diz Paul Roetzer, fundador e CEO do Marketing AI Institute, que detalhou a situação para mim no Episódio 97 do The Artificial Intelligence Show.

“Acho que todos estão apenas fazendo apostas aqui,” ele afirma. “A Amazon está fazendo o mesmo. O Google também. Não acredito que saibamos como os vencedores se sairão aqui.”

Ele destacou que provavelmente haverá espaço no mercado tanto para modelos de fronteira massivos quanto para IA menores que funcionam localmente. Os próprios clientes da Microsoft podem querer a flexibilidade de trabalhar com modelos de terceiros como o GPT-4 enquanto mantêm seus dados no Azure, ou optar por interagir exclusivamente com a IA desenvolvida internamente pela Microsoft.

“O mercado está tão no início que simplesmente não há como prever isso, e eu não acho que a Microsoft queira ficar de fora do jogo dos modelos de fronteira,” explicou Roetzer.

“Eles podem acabar percebendo que conseguem construir um modelo maior e melhor do que a OpenAI.”

Os detalhes sobre exatamente para que o MAI-1 será usado e como ele se comparará aos rivais ainda são escassos. Com um tamanho estimado de 500 bilhões de parâmetros, seria aproximadamente metade do tamanho do GPT-4 (que a The Information estima ter mais de 1 trilhão de parâmetros).

Fontes informaram à The Information que os planos da Microsoft para o MAI-1 dependerão de quão bem ele performar, mas a empresa pode apresentar o modelo já neste mês em sua conferência para desenvolvedores Build.

Uma coisa é certa:

Com seus imensos recursos e talento técnico, a Microsoft está certamente bem posicionada para causar impacto com um modelo de IA interno. A empresa possui:

  • Infraestrutura computacional extensa através do Azure
  • Uma quantidade enorme de dados para treinar modelos
  • Especialização em IA de alto nível, reforçada pela aquisição da Inflection
  • Anos de experiência proveniente de sua parceria estreita com a OpenAI

“A Microsoft tem todos os recursos do mundo para fazer isso,” observou Roetzer. “Parece apenas absurdo não estar explorando todos os caminhos agora até entendermos melhor como isso se desenrola.”



Bolt42