Modelos de IA estão sendo lançados a uma velocidade impressionante, por todos, desde grandes empresas de tecnologia como Google até startups como OpenAI e Anthropic. Manter-se atualizado com os mais recentes pode ser avassalador.
Para adicionar à confusão, os modelos de IA são frequentemente promovidos com base em benchmarks da indústria. No entanto, essas métricas técnicas revelam pouco sobre como pessoas e empresas reais realmente os utilizam.
Para cortar o ruído, o TechCrunch compilou uma visão geral dos modelos de IA mais avançados lançados desde 2024, com detalhes sobre como usá-los e para que são melhores. Manteremos esta lista atualizada com os lançamentos mais recentes também.
Existem literalmente mais de um milhão de modelos de IA disponíveis: Hugging Face, por exemplo, abriga mais de 1,4 milhões. Portanto, esta lista pode deixar de fora alguns modelos que poderiam ter um desempenho melhor, de uma forma ou de outra.
Modelos de IA lançados em 2025
Aya Vision da Cohere
A Cohere lançou um modelo multimodal chamado Aya Vision que afirma ser o melhor da classe em fazer coisas como legendas de imagens e responder perguntas sobre fotos. Ele também se destaca em idiomas além do inglês, ao contrário de outros modelos, alega a Cohere. Está disponível gratuitamente no WhatsApp.
GPT 4.5 ‘Orion’ da OpenAI
A OpenAI chama Orion de seu maior modelo até agora, destacando seu forte “conhecimento do mundo” e “inteligência emocional.” No entanto, ele apresenta desempenho inferior em certos benchmarks em comparação com modelos de raciocínio mais novos. Orion está disponível para assinantes do plano de $200 por mês da OpenAI.
Claude Sonnet 3.7
A Anthropic afirma que este é o primeiro modelo de raciocínio ‘híbrido’ da indústria, pois pode tanto fornecer respostas rápidas quanto realmente pensar mais detalhadamente quando necessário. Ele também oferece aos usuários controle sobre quanto tempo o modelo pode pensar, de acordo com a Anthropic. Sonnet 3.7 está disponível para todos os usuários do Claude, mas os usuários mais frequentes precisarão de um plano Pro de $20 por mês.
Grok 3 da xAI
Grok 3 é o mais recente modelo flagship da startup xAI, fundada por Elon Musk. Afirma-se que ele supera outros modelos líderes em matemática, ciências e codificação. O modelo exige X Premium (que custa $50 por mês). Após um estudo descobrir que o Grok 2 tinha uma tendência à esquerda, Musk prometeu tornar o Grok mais “politicamente neutro”, mas não está claro se isso foi alcançado.
o3-mini da OpenAI
Este é o mais recente modelo de raciocínio da OpenAI e é otimizado para tarefas relacionadas a STEM, como codificação, matemática e ciências. Não é o modelo mais poderoso da OpenAI, mas, devido ao seu tamanho menor, a empresa afirma que é significativamente mais barato. Está disponível gratuitamente, mas requer uma assinatura para usuários que o utilizam com frequência.
Deep Research da OpenAI
A pesquisa profunda da OpenAI é projetada para realizar pesquisas detalhadas sobre um tópico com citações claras. Este serviço está disponível apenas com a assinatura Pro de $200 por mês do ChatGPT. A OpenAI recomenda para tudo, desde ciência até pesquisa de compras, mas cuidado, pois alucinações continuam a ser um problema para a IA.
Le Chat da Mistral
A Mistral lançou versões de aplicativos do Le Chat, um assistente pessoal de IA multimodal. A Mistral afirma que Le Chat responde mais rápido do que qualquer outro chatbot. Também existe uma versão paga com jornalismo atualizado da AFP. Testes do Le Monde encontraram o desempenho do Le Chat impressionante, embora tenha cometido mais erros do que o ChatGPT.
Operator da OpenAI
O Operator da OpenAI é destinado a ser um estagiário pessoal que pode fazer coisas de forma independente, como ajudar você a comprar mantimentos. Ele requer uma assinatura do ChatGPT Pro de $200 por mês. Os agentes de IA têm um grande potencial, mas ainda são experimentais: um revisor do Washington Post diz que o Operator decidiu por conta própria pedir uma dúzia de ovos por $31, pago com o cartão de crédito do revisor.
Google Gemini 2.0 Pro Experimental
O tão aguardado modelo flagship da Google Gemini diz que se destaca em codificação e compreensão de conhecimento geral. Ele também tem uma janela de contexto super longa de 2 milhões de tokens, ajudando usuários que precisam processar rapidamente grandes quantidades de texto. O serviço exige, no mínimo, uma assinatura do Google One AI Premium de $19,99 por mês.
Modelos de IA lançados em 2024
DeepSeek R1
Este modelo de IA chinês fez sucesso no Vale do Silício. O R1 da DeepSeek se destaca em codificação e matemática, enquanto sua natureza de código aberto significa que qualquer pessoa pode executá-lo localmente. Além disso, é gratuito. Contudo, o R1 integra a censura do governo chinês e enfrenta crescentes proibições por potencialmente enviar dados de usuários de volta à China.
Gemini Deep Research
A Pesquisa Profunda resume os resultados de busca do Google em um documento simples e bem-citado. O serviço é útil para estudantes e qualquer outra pessoa que precise de um resumo rápido da pesquisa. No entanto, sua qualidade não é nem de perto tão boa quanto a de um artigo revisado por pares. A Pesquisa Profunda requer uma assinatura do Google One AI Premium de $19,99.
Meta Llama 3.3 70B
Esta é a versão mais nova e avançada dos modelos de IA Llama de código aberto da Meta. A Meta anunciou essa versão como a mais barata e eficiente até agora, especialmente para matemática, conhecimento geral e seguimento de instruções. É gratuito e de código aberto.
Sora da OpenAI
Sora é um modelo que cria vídeos realistas com base em texto. Embora possa gerar cenas inteiras em vez de apenas clipes, a OpenAI admite que frequentemente gera “física irreal.” Atualmente, está disponível apenas nas versões pagas do ChatGPT, começando pelo Plus, que custa $20 por mês.
Qwen QwQ-32B-Preview da Alibaba
Este modelo é um dos poucos a rivalizar com o o1 da OpenAI em determinados benchmarks do setor, destacando-se em matemática e codificação. Ironicamente para um “modelo de raciocínio,” ele tem “margem para melhoria em raciocínio de senso comum”, afirma a Alibaba. Também incorpora a censura do governo chinês, mostram os testes do TechCrunch. É gratuito e de código aberto.
Computer Use da Anthropic
O uso do computador do Claude é destinado a assumir o controle do seu computador para completar tarefas como codificação ou reserva de passagens aéreas, tornando-se um predecessor do Operator da OpenAI. O uso do computador, no entanto, permanece em beta. A precificação é por API: $0,80 por milhão de tokens de entrada e $4 por milhão de tokens de saída.
Grok 2 da x.AI
A empresa de IA de Elon Musk, x.AI, lançou uma versão aprimorada de seu chatbot flagship Grok 2, que afirma ser “três vezes mais rápido.” Usuários gratuitos têm um limite de 10 perguntas a cada duas horas no Grok, enquanto assinantes dos planos Premium e Premium+ do X desfrutam de limites de uso mais altos. A x.AI também lançou um gerador de imagens, Aurora, que produz imagens altamente fotorealistas, incluindo alguns conteúdos gráficos ou violentos.
o1 da OpenAI
A família o1 da OpenAI é destinada a produzir respostas melhores ao “pensar” nas respostas através de um recurso oculto de raciocínio. O modelo se destaca em codificação, matemática e segurança, afirma a OpenAI, mas também apresenta dificuldades em enganar humanos. A utilização do o1 requer a assinatura do ChatGPT Plus, que custa $20 por mês.
Claude Sonnet 3.5 da Anthropic
Claude Sonnet 3.5 é um modelo que a Anthropic afirma ser o melhor da classe. Tem se tornado conhecido por suas capacidades de codificação e é considerado o chatbot de escolha dos insiders da tecnologia. O modelo pode ser acessado gratuitamente no Claude, embora usuários frequentes precisem de uma assinatura Pro de $20 por mês. Embora possa entender imagens, não pode gerá-las.
GPT 4o-mini da OpenAI
A OpenAI tem promovido o GPT 4o-mini como seu modelo mais acessível e rápido até agora, devido ao seu tamanho reduzido. Ele é destinado a permitir uma ampla gama de tarefas, como o funcionamento de chatbots de atendimento ao cliente. O modelo está disponível na faixa gratuita do ChatGPT. É mais adequado para tarefas simples de alto volume em comparação com tarefas mais complexas.
Command R+ da Cohere
O modelo Command R+ da Cohere se destaca em complexas aplicações de Geração Aumentada por Recuperação (RAG) para empresas. Isso significa que ele pode encontrar e citar peças específicas de informação muito bem. (O inventor do RAG realmente trabalha na Cohere.) No entanto, o RAG não resolve completamente o problema das alucinações da IA.
Conteúdo relacionado
Nova ‘Modo de IA’ do Google Search permite que usuários façam perguntas complexas e em várias partes
[the_ad id="145565"] O Google está lançando um novo recurso experimental chamado “Modo AI” no Search, que visa competir com serviços populares como Perplexity AI e o Busca do…
Ceramic.ai de Anna Patterson busca ajudar empresas a construir modelos de IA de forma mais rápida e eficiente.
[the_ad id="145565"] Anna Patterson teve uma carreira notável no Vale do Silício. Ela fundou três startups, incluindo as novidades em mecanismos de busca, Xift e Cuil, além de…
Antes de um possível IPO de $4 bilhões, os fundadores da CoreWeave já embolsaram $488 milhões.
[the_ad id="145565"] O documento S-1 inicial da CoreWeave para seu próximo IPO está repleto de surpresas. Apoiada pela Nvidia, a CoreWeave opera um serviço de nuvem específico…