Os modelos de IA mais avançados: o que fazem e como utilizá-los.

Modelos de IA estão sendo desenvolvidos a uma velocidade impressionante, por todos, desde grandes empresas de tecnologia como o Google até startups como OpenAI e Anthropic. Acompanhar os mais recentes pode ser esmagador.

Para complicar ainda mais, os modelos de IA são frequentemente promovidos com base em benchmarks da indústria. No entanto, essas métricas técnicas muitas vezes revelam pouco sobre como pessoas reais e empresas realmente os utilizam.

Para cortar o ruído, o TechCrunch compilou uma visão geral dos modelos de IA mais avançados lançados desde 2024, com detalhes sobre como usá-los e para que são mais adequados. Também manteremos essa lista atualizada com os mais recentes lançamentos.

Existem, literalmente, mais de um milhão de modelos de IA por aí: o Hugging Face, por exemplo, hospeda mais de 1,4 milhão deles. Portanto, essa lista pode deixar de fora alguns modelos que se saem melhor, de uma forma ou de outra.

Modelos de IA lançados em 2025

OpenAI GPT 4.5 ‘Orion’

A OpenAI chama Orion de seu maior modelo até hoje, vangloriando-se de seu forte “conhecimento mundial” e “inteligência emocional”. No entanto, ele apresenta desempenho inferior em certos benchmarks quando comparado a modelos de raciocínio mais novos. Orion está disponível para assinantes do plano de $200 por mês da OpenAI.

Claude Sonnet 3.7

A Anthropic afirma que este é o primeiro modelo de raciocínio ‘híbrido’ da indústria, pois pode fornecer respostas rápidas e realmente pensar de forma mais aprofundada quando necessário. Ele também oferece aos usuários controle sobre quanto tempo o modelo pode pensar, de acordo com a Anthropic. Sonnet 3.7 está disponível para todos os usuários do Claude, mas usuários mais frequentes precisarão de um plano Pro de $20 por mês.

xAI Grok 3

Grok 3 é o mais recente modelo principal da startup xAI, fundada por Elon Musk. Alega-se que ele supera outros modelos líderes em matemática, ciência e programação. O modelo requer assinatura do X Premium (que custa $50 por mês). Após um estudo que descobriu que o Grok 2 tendia para a esquerda, Musk prometeu tornar o Grok mais “politicamente neutro”, mas não está claro se isso foi alcançado.

OpenAI o3-mini

Este é o mais recente modelo de raciocínio da OpenAI, otimizado para tarefas relacionadas a STEM, como programação, matemática e ciências. Não é o modelo mais poderoso da OpenAI, mas devido ao seu tamanho menor, a empresa afirma que é significativamente mais barato. Está disponível gratuitamente, mas requer assinatura para usuários pesados.

OpenAI Deep Research

A pesquisa profunda da OpenAI é projetada para realizar pesquisas detalhadas sobre um tópico com citações claras. Este serviço está disponível apenas com a assinatura Pro de $200 por mês do ChatGPT. A OpenAI recomenda para tudo, desde ciência até pesquisa de compras, mas cuidado: alucinações continuam sendo um problema para a IA.

Mistral Le Chat

A Mistral lançou versões de aplicativos do Le Chat, um assistente pessoal de IA multimodal. Mistral afirma que o Le Chat responde mais rápido do que qualquer outro chatbot. Também há uma versão paga com jornalismo atualizado da AFP. Testes do Le Monde descobriram que o desempenho do Le Chat foi impressionante, embora tenha cometido mais erros do que o ChatGPT.

OpenAI Operator

O Operator da OpenAI é destinado a ser um estagiário pessoal que pode fazer coisas de forma independente, como ajudar na compra de mantimentos. Requer uma assinatura Pro do ChatGPT de $200 por mês. Agentes de IA têm muito potencial, mas ainda são experimentais: um revisor do Washington Post disse que o Operator decidiu por conta própria encomendar uma dúzia de ovos por $31, pagos com o cartão de crédito do revisor.

Google Gemini 2.0 Pro Experimental

O tão aguardado modelo principal do Google Gemini diz que se destaca em programação e compreensão de conhecimento geral. Também possui uma janela de contexto super longa de 2 milhões de tokens, ajudando os usuários que precisam processar rapidamente grandes quantidades de texto. O serviço requer (no mínimo) uma assinatura do Google One AI Premium de $19,99 por mês.

Modelos de IA lançados em 2024

DeepSeek R1

Este modelo de IA chinês surpreendeu o Vale do Silício. O R1 da DeepSeek se destaca em programação e matemática, enquanto sua natureza de código aberto significa que qualquer um pode executá-lo localmente. Além disso, é grátis. No entanto, o R1 integra a censura do governo chinês e enfrenta crescentes proibições por potencialmente enviar dados de usuários de volta para a China.

Gemini Deep Research

A Deep Research resume os resultados de busca do Google em um documento simples e bem referenciado. O serviço é útil para estudantes e qualquer outra pessoa que precise de um resumo rápido de pesquisa. No entanto, sua qualidade não é nem de longe tão boa quanto a de um artigo revisado por pares. A Deep Research requer uma assinatura do Google One AI Premium de $19,99 por mês.

Meta Llama 3.3 70B

Esta é a versão mais nova e avançada dos modelos de IA de código aberto Llama da Meta. A Meta destacou esta versão como a mais barata e eficiente até agora, especialmente para matemática, conhecimento geral e seguindo instruções. É gratuito e de código aberto.

OpenAI Sora

Sora é um modelo que cria vídeos realistas com base em texto. Embora possa gerar cenas inteiras em vez de apenas clipes, a OpenAI admite que muitas vezes cria “físicas irreais”. Atualmente, está disponível apenas nas versões pagas do ChatGPT, começando com o Plus, que custa $20 por mês.

Alibaba Qwen QwQ-32B-Preview

Este modelo é um dos poucos que rivalizam com o o1 da OpenAI em certos benchmarks da indústria, destacando-se em matemática e programação. Ironicamente para um “modelo de raciocínio”, ele tem “espaço para melhorias no raciocínio de bom senso”, afirma a Alibaba. Também incorpora a censura do governo chinês, segundo testes do TechCrunch. É gratuito e de código aberto.

Anthropic Computer Use

O Computer Use do Claude é destinado a controlar seu computador para realizar tarefas, como codificação ou reserva de passagens aéreas, tornando-se um predecessor do Operator da OpenAI. O uso de computador, no entanto, ainda está em beta. A precificação é via API: $0,80 por milhão de tokens de entrada e $4 por milhão de tokens de saída.

x.AI Grok 2

A empresa de IA de Elon Musk, x.AI, lançou uma versão aprimorada de seu chatbot principal Grok 2, que alega ser “três vezes mais rápido”. Usuários gratuitos estão limitados a 10 perguntas a cada duas horas no Grok, enquanto assinantes dos planos Premium e Premium+ do X desfrutam de limites de uso mais altos. A x.AI também lançou um gerador de imagens, Aurora, que produz imagens altamente fotorrealistas, incluindo alguns conteúdos gráficos ou violentos.

OpenAI o1

A família o1 da OpenAI é destinada a produzir melhores respostasao “pensar” nas respostas através de um recurso oculto de raciocínio. O modelo se destaca em programação, matemática e segurança, afirma a OpenAI, mas também tem problemas em enganar humanos. Usar o o1 requer assinatura do ChatGPT Plus, que custa $20 por mês.

Claude Sonnet 3.5 da Anthropic

Claude Sonnet 3.5 é um modelo que a Anthropic classifica como o melhor da categoria. Tornou-se conhecido por suas capacidades de programação e é considerado o chatbot preferido entre os conhecedores de tecnologia. O modelo pode ser acessado gratuitamente no Claude, embora usuários pesados precisem de uma assinatura Pro de $20 por mês. Embora possa entender imagens, não pode gerá-las.

OpenAI GPT 4o-mini

A OpenAI destacou o GPT 4o-mini como seu modelo mais acessível e rápido até agora, graças ao seu tamanho pequeno. Ele é destinado a permitir uma ampla gama de tarefas, como operar chatbots de atendimento ao cliente. O modelo está disponível na camada gratuita do ChatGPT. É mais adequado para tarefas simples de alto volume em comparação com tarefas mais complexas.

Cohere Command R+

O modelo Command R+ da Cohere se destaca em aplicações complexas de Geração Aumentada por Recuperação (RAG) para empresas. Isso significa que pode encontrar e citar peças específicas de informação muito bem. (O inventor do RAG realmente trabalha na Cohere.) No entanto, RAG não resolve completamente o problema de alucinação da IA.

Conteúdo relacionado

BusinessInteligência artificial