Bolt42

Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder no setor. Saiba Mais


A startup de inteligência artificial de Elon Musk, xAI, revelou Grok 3, seu mais recente modelo de IA que a empresa afirma superar concorrentes de destaque em importantes referências técnicas. O anúncio marca uma escalada significativa na corrida para desenvolver sistemas de IA mais poderosos.

A lançamento acontece poucos dias após a insatisfatória oferta de Musk de $97,4 bilhões para adquirir a OpenAI, a empresa que ele co-fundou com Sam Altman em 2015. Durante uma demonstração transmitida ao vivo no X, Musk caracterizou o Grok 3 como “uma ordem de magnitude mais capaz que o Grok 2” e enfatizou sua habilidade de raciocinar através de problemas complexos.

Testes iniciais parecem apoiar algumas das reivindicações da xAI. O modelo liderou o influente Chatbot Arena, pontuando mais alto que o GPT-4o da OpenAI, o Gemini do Google e o modelo V3 da DeepSeek em testes com usuários em modo cego. Os benchmarks publicados mostram o Grok 3 alcançando pontuações superiores em matemática (AIME ’24), raciocínio científico (GPQA) e tarefas de programação.

Grok 3 lidera a tabela do Chatbot Arena com uma pontuação de aproximadamente 1400, superando significativamente outros modelos de IA em testes com usuários em modo cego. (Fonte: xAI)

Dentro da imensa infraestrutura computacional do Grok 3: 200.000 GPUs e um novo data center

“Grok 3 claramente possui capacidades de pensar quase de última geração,” escreveu o ex-pesquisador da OpenAI Andrej Karpathy em um post no X após testes de acesso antecipado. “Poucos modelos acertam isso de maneira confiável. Os principais modelos de pensamento da OpenAI conseguem, mas todos os modelos DeepSeek-R1, Gemini 2.0 Flash Thinking e Claude não.”

O desenvolvimento do modelo exigiu recursos computacionais massivos. A xAI duplicou seu cluster de GPUs para 200.000 chips Nvidia para treinamento, localizados em um novo data center em Memphis. Esse investimento em infraestrutura destaca as crescentes demandas computacionais do desenvolvimento avançado de IA, enquanto as empresas competem para construir sistemas mais capazes.

DeepSearch e raciocínio avançado: como Grok 3 pretende superar ChatGPT e Google Gemini

Uma das inovações-chave é o recurso “DeepSearch” do Grok 3, que combina busca na web com capacidades de raciocínio para analisar informações de múltiplas fontes. O sistema também inclui modos especializados para resolução de problemas complexos, incluindo uma função “Pensar” que mostra seu processo de raciocínio e um modo “Big Brain” que aloca potência computacional adicional para tarefas difíceis.

“A coisa a prestar atenção real em IA é a velocidade de aprendizado. E @xai está aprendendo muito mais rápido que qualquer outro,” postou o veterano da indústria tecnológica Robert Scoble, citando uma conversa com Tom Gruber, cofundador da Apple Siri.

Entretanto, algumas limitações emergiram durante os testes. Karpathy observou que o modelo às vezes fabrica citações e enfrenta dificuldades com certos tipos de humor e tarefas de raciocínio ético. Esses desafios são comuns em sistemas de IA atuais e evidenciam as contínuas dificuldades em desenvolver inteligência artificial realmente humana.

O CEO da Scale.ai, Alexandr Wang, elogiou o lançamento, twittando: “Grok 3 é o novo melhor modelo do mundo da equipe @xai!” Ele destacou seu desempenho superior em vários benchmarks e expressou entusiasmo por futuras colaborações.

A competição na indústria de IA esquenta: o que o lançamento do Grok 3 significa para a OpenAI, DeepSeek e o futuro da inteligência artificial

O modelo estará disponível através da assinatura Premium+ do X ($40/mês) e um novo serviço autônomo “SuperGrok” ($30/mês). O acesso à API para empresas está planejado para as próximas semanas.

Esse lançamento intensifica a competição na indústria de IA, especialmente com a startup chinesa DeepSeek, que recentemente demonstrou desempenho comparável com requisitos computacionais, aparentemente, mais baixos. O desenvolvimento também levanta questões sobre a sustentabilidade da corrida armamentista computacional em IA, enquanto as empresas investem bilhões em infraestruturas de hardware cada vez mais poderosas.

Em benchmarks de desempenho chave, Grok 3 e sua variante mini apresentam pontuações superiores em testes de matemática, ciência e programação em comparação com modelos concorrentes da Google, OpenAI, Anthropic e DeepSeek. O modelo Grok 3 de tamanho completo (azul escuro) obteve resultados particularmente fortes em raciocínio científico. (Fonte: xAI)

Musk enfatizou que o Grok 3 permanece em beta, com melhorias esperadas “quase todos os dias.” A empresa planeja adicionar capacidades de interação por voz dentro de semanas e tornará open-source seu modelo anterior, Grok 2, assim que a nova versão estabilizar.

No entanto, talvez o aspecto mais revelador da estreia do Grok 3 não sejam suas especificações técnicas ou pontuações de benchmark, mas o que ele representa: a crescente tensão entre Musk e seus ex-colegas da OpenAI. Apenas dias após sua proposta não aceita de $97,4 bilhões para adquirir a OpenAI, Musk lançou um modelo que desafia sua supremacia — sugerindo que na corrida de alto risco pela dominância em IA, até mesmo um pretendente rejeitado pode se tornar um rival formidável.





    10 − um =




    Bolt42