Modelos de IA estão sendo produzidos em um ritmo impressionante, por todos, desde grandes empresas de tecnologia como o Google até startups como OpenAI e Anthropic. Acompanhar os mais recentes pode ser avassalador.
Para agravar a confusão, os modelos de IA são frequentemente promovidos com base em benchmarks da indústria. Mas essas métricas técnicas geralmente revelam pouco sobre como pessoas e empresas reais realmente os utilizam.
Para cortar o ruído, o TechCrunch compilou uma visão geral dos modelos de IA mais avançados lançados desde 2024, com detalhes sobre como usá-los e para que são mais indicados. Manteremos esta lista atualizada com os lançamentos mais recentes também.
Existem literalmente centenas de milhares de modelos de IA disponíveis: o HuggingFace, por exemplo, hospeda mais de 900.000. Portanto, esta lista pode deixar de fora alguns modelos que desempenham melhor, de uma forma ou de outra.
Modelos de IA lançados em 2025
OpenAI o3-mini
Este é o mais recente modelo de raciocínio da OpenAI, otimizado para tarefas relacionadas a STEM, como codificação, matemática e ciências. Não é o modelo mais poderoso da OpenAI, mas, por ser menor, a empresa afirma que é significativamente mais barato. Está disponível gratuitamente, mas requer uma assinatura para usuários frequentes.
OpenAI Deep Research
A Deep Research da OpenAI é projetada para realizar pesquisas aprofundadas sobre um tema com citações claras. Este serviço está disponível apenas com a assinatura Pro do ChatGPT, que custa $200 por mês. A OpenAI recomenda para tudo, desde pesquisa científica até pesquisa de compras, mas esteja ciente de que as alucinações continuam sendo um problema para a IA.
Mistral Le Chat
A Mistral lançou versões de aplicativo do Le Chat, um assistente pessoal multimodal de IA. A Mistral afirma que Le Chat responde mais rápido do que qualquer outro chatbot. Também possui uma versão paga com jornalismo atualizado da AFP. Testes do Le Monde encontraram um desempenho impressionante do Le Chat, embora tenha cometido mais erros do que o ChatGPT.
OpenAI Operator
O Operator da OpenAI é destinado a ser um estagiário pessoal que pode fazer coisas de forma independente, como ajudá-lo a comprar mantimentos. Exige uma assinatura de $200 por mês do ChatGPT Pro. Os agentes de IA têm muito potencial, mas ainda estão em fase experimental: um revisor do Washington Post disse que o Operator decidiu por conta própria pedir uma dúzia de ovos por $31, pagou com o cartão de crédito do revisor.
Google Gemini 2.0 Pro Experimental
O modelo tão aguardado da Google Gemini diz que se destaca em codificação e compreensão de conhecimento geral. Ele também possui uma janela de contexto super longa de 2 milhões de tokens, ajudando os usuários que precisam processar rapidamente grandes volumes de texto. O serviço requer, no mínimo, uma assinatura do Google One AI Premium de $19,99 por mês.
Modelos de IA lançados em 2024
DeepSeek R1
Este modelo de IA chinês tomou conta do Vale do Silício. O R1 da DeepSeek se destaca em codificação e matemática, enquanto sua natureza de código aberto permite que qualquer pessoa o execute localmente. Além disso, é gratuito. No entanto, o R1 integra a censura do governo chinês e enfrenta proibições crescentes por potencialmente enviar dados de usuários de volta à China.
Gemini Deep Research
Deep Research resume os resultados de pesquisa do Google em um documento simples e bem citado. O serviço é útil para estudantes e qualquer pessoa que precise de um resumo rápido de pesquisa. No entanto, sua qualidade não é tão boa quanto a de um artigo revisado por pares. Deep Research requer uma assinatura do Google One AI Premium de $19,99.
Meta Llama 3.3 7B
Esta é a versão mais nova e avançada dos modelos de IA de código aberto Llama da Meta. A Meta anunciou que esta versão é a mais econômica e eficiente até agora, especialmente para matemática, conhecimento geral e seguindo instruções. É gratuito e de código aberto.
OpenAI Sora
Sora é um modelo que cria vídeos realistas com base em texto. Embora possa gerar cenas inteiras em vez de apenas clipes, a OpenAI admite que muitas vezes gera “física irreal”. Atualmente, está disponível apenas nas versões pagas do ChatGPT, começando com o Plus, que custa $20 por mês.
Alibaba Qwen QwQ-32B-Preview
Este modelo é um dos poucos que rivalizam com o o1 da OpenAI em certos benchmarks da indústria, destacando-se em matemática e codificação. Ironicamente para um ‘modelo de raciocínio’, ele tem “espaço para melhorias em raciocínio de senso comum”, diz a Alibaba. Ele também incorpora a censura do governo chinês, segundo testes do TechCrunch. É gratuito e de código aberto.
Anthropic’s Computer Use
O Computer Use do Claude é destinado a controlar seu computador para executar tarefas como codificação ou reserva de passagens aéreas, tornando-se um precursor do Operator da OpenAI. O uso do computador, no entanto, ainda está em beta. Os preços são via API: $0,80 por milhão de tokens de entrada e $4 por milhão de tokens de saída.
x.AI’s Grok 2
A x.AI, a empresa de IA pertencente a Elon Musk, lançou uma versão aprimorada de seu chatbot Grok 2, que afirma ser “três vezes mais rápido”. Usuários gratuitos estão limitados a 10 perguntas a cada duas horas no Grok, enquanto assinantes dos planos Premium e Premium+ do X desfrutam de limites de uso mais altos. A x.AI também lançou um gerador de imagens, Aurora, que produz imagens altamente fotorealistas, incluindo conteúdo gráfico ou violento.
OpenAI o1
A família o1 da OpenAI visa produzir melhores respostas, “pensando” nas respostas através de uma funcionalidade de raciocínio oculta. O modelo se destaca em codificação, matemática e segurança, afirma a OpenAI, mas também enfrenta problemas ao enganar humanos. O o1 requer uma assinatura do ChatGPT Plus, que custa $20 por mês.
Anthropic’s Claude Sonnet 3.5
O Claude Sonnet 3.5 é um modelo que a Anthropic considera como o melhor em sua classe. Ele se tornou conhecido por suas capacidades de codificação e é considerado o chatbot preferido dos insiders de tecnologia. O modelo pode ser acessado gratuitamente no Claude, embora usuários frequentes precisem de uma assinatura Pro de $20 por mês. Embora possa entender imagens, não pode gerá-las.
OpenAI GPT 4o-mini
A OpenAI anunciou o GPT 4o-mini como seu modelo mais acessível e mais rápido até agora, graças ao seu tamanho reduzido. Ele é destinado a habilitar uma ampla gama de tarefas, como alimentar chatbots de serviço ao cliente. O modelo está disponível na camada gratuita do ChatGPT. É mais adequado para tarefas simples e de alto volume em comparação com tarefas mais complexas.
Cohere Command R+
O modelo Command R+ da Cohere se destaca em aplicações complexas de Geração Aumentada por Recuperação (ou RAG) para empresas. Isso significa que ele pode encontrar e citar peças específicas de informação muito bem. (O inventor do RAG realmente trabalha na Cohere.) No entanto, o RAG não resolve completamente o problema de alucinação da IA. Os modelos da Cohere são destinados a usuários corporativos.
Conteúdo relacionado
Qualcomm adquire divisão de IA generativa da startup vietnamita VinAI
[the_ad id="145565"] A Qualcomm adquiriu a divisão de IA generativa da VinAI, uma empresa de pesquisa em IA com sede em Hanói, por um valor não revelado, conforme anunciado…
Sam Altman afirma que os problemas de capacidade da OpenAI causarão atrasos nos produtos.
[the_ad id="145565"] Em uma série de publicações no X na segunda-feira, o CEO da OpenAI, Sam Altman, afirmou que a popularidade da nova ferramenta de geração de imagens no…
Chefe de pesquisa em IA da Meta planeja deixar a empresa.
[the_ad id="145565"] A VP de pesquisa em IA da Meta, Joelle Pineau, anunciou que está planejando deixar a empresa em uma publicação no Facebook na terça-feira. Pineau afirmou…