Bolt42

Modelos de IA estão sendo produzidos a um ritmo alucinante, por todos, desde grandes empresas de tecnologia como Google até startups como OpenAI e Anthropic. Manter-se atualizado sobre os mais recentes pode ser esmagador.

Para aumentar a confusão, os modelos de IA são frequentemente promovidos com base em benchmarks da indústria. No entanto, essas métricas técnicas muitas vezes revelam pouco sobre como as pessoas e as empresas realmente os utilizam.

Para cortar o ruído, o TechCrunch compilou uma visão geral dos modelos de IA mais avançados lançados desde 2024, com detalhes sobre como usá-los e para que são melhores. Manteremos esta lista atualizada com os últimos lançamentos também.

Existem literalmente mais de um milhão de modelos de IA por aí: o Hugging Face, por exemplo, hospeda mais de 1,4 milhão. Portanto, esta lista pode deixar de fora alguns modelos que apresentam um desempenho melhor, de alguma forma.

Modelos de IA lançados em 2025

Google Gemini 2.5

A Gemini 2.5 Pro Experimental, um modelo de raciocínio, se destaca em construção de aplicativos web e agentes de código, de acordo com o Google. No entanto, tem um desempenho inferior em um benchmark popular de codificação em comparação com o Claude Sonnet 3.7. O modelo requer uma assinatura mensal Gemini Advanced de $20.

Gerador de imagens ChatGPT-4o

A OpenAI atualizou seu modelo existente GPT-4o para gerar imagens, não apenas textos. O modelo aprimorado logo se tornou viral por transformar imagens em estilo anime do Studio Ghibli, apesar de preocupações óbvias de direitos autorais. O acesso ao GPT-4o requer, no mínimo, uma assinatura do ChatGPT Plus de $20 por mês.

Câmera Virtual Estável da Stability AI

A startup de geração de imagens Stability AI lançou um modelo que a empresa afirma ser capaz de gerar cenas 3D e ângulos de câmera a partir de uma única imagem 2D. No entanto, ainda enfrenta dificuldades com cenas que apresentam elementos mais complexos, como humanos e água em movimento. O modelo está disponível para uso em pesquisa não comercial no HuggingFace.

Visão Aya da Cohere

A Cohere lançou um modelo multimodal chamado Aya Vision que afirma ser o melhor em tarefas como legendagem de imagens e responder perguntas sobre fotos. Ele também se destaca em idiomas que não são o inglês, ao contrário de outros modelos, segundo a Cohere. Está disponível gratuitamente no WhatsApp.

OpenAI GPT 4.5 “Orion”

A OpenAI chama Orion de seu maior modelo até hoje, destacando seu forte “conhecimento do mundo” e “inteligência emocional”. No entanto, tem um desempenho inferior em certos benchmarks em comparação com modelos de raciocínio mais novos. Orion está disponível para assinantes do plano de $200 por mês da OpenAI.

Claude Sonnet 3.7

A Anthropic afirma que este é o primeiro modelo de raciocínio “híbrido” da indústria, pois pode tanto fornecer respostas rápidas quanto realmente pensar as coisas com calma quando necessário. Ele também dá aos usuários controle sobre quanto tempo o modelo pode pensar, segundo a Anthropic. O Sonnet 3.7 está disponível para todos os usuários de Claude, mas os usuários mais intensivos precisarão de um plano Pro de $20 por mês.

Grok 3 da xAI

Grok 3 é o mais recente modelo carro-chefe da startup xAI, fundada por Elon Musk. Alega-se que supera outros modelos líderes em matemática, ciência e codificação. O modelo requer uma assinatura do X Premium (que custa $50 por mês). Após um estudo encontrar que o Grok 2 tendia à esquerda, Musk prometeu tornar o Grok mais “politicamente neutro”, mas ainda não está claro se isso foi alcançado.

OpenAI o3-mini

Este é o mais recente modelo de raciocínio da OpenAI e está otimizado para tarefas relacionadas a STEM, como codificação, matemática e ciências. Não é o modelo mais poderoso da OpenAI, mas, por ser menor, a empresa afirma que tem custo significativamente mais baixo. Está disponível gratuitamente, mas requer uma assinatura para usuários intensivos.

Pesquisa Profunda da OpenAI

A Pesquisa Profunda da OpenAI é projetada para realizar pesquisas aprofundadas sobre um tópico com citações claras. Este serviço está disponível apenas com a assinatura Pro de $200 por mês do ChatGPT. A OpenAI recomenda para tudo, desde ciências até pesquisas de compras, mas tenha cuidado, pois alucinações continuam sendo um problema para a IA.

Le Chat da Mistral

A Mistral lançou versões de aplicativos do Le Chat, um assistente pessoal de IA multimodal. A Mistral afirma que o Le Chat responde mais rápido do que qualquer outro chatbot. Há também uma versão paga com jornalismo atualizado da AFP. Testes do Le Monde encontraram o desempenho do Le Chat impressionante, embora tenha cometido mais erros do que o ChatGPT.

Operador da OpenAI

O Operador da OpenAI é destinado a ser um estagiário pessoal que pode realizar tarefas de forma independente, como ajudar você a comprar mantimentos. Requer uma assinatura Pro do ChatGPT de $200 por mês. Agentes de IA têm muita promessa, mas ainda são experimentais: Um revisor do Washington Post disse que o Operador decidiu por conta própria pedir uma dúzia de ovos por $31, pago com o cartão de crédito do revisor.

Google Gemini 2.0 Pro Experimental

O muito aguardado modelo carro-chefe da Google Gemini afirma se destacar em codificação e compreensão de conhecimento geral. Também possui uma janela de contexto super longa de 2 milhões de tokens, ajudando usuários que precisam processar rapidamente grandes volumes de texto. O serviço requer, no mínimo, uma assinatura do Google One AI Premium de $19,99 por mês.

Modelos de IA lançados em 2024

DeepSeek R1

Este modelo de IA chinês tomou conta do Vale do Silício. O R1 da DeepSeek se destaca em codificação e matemática, enquanto sua natureza de código aberto significa que qualquer um pode executá-lo localmente. Além disso, é gratuito. No entanto, o R1 integra a censura do governo chinês e enfrenta proibições crescentes por potencialmente enviar dados do usuário de volta para a China.

Pesquisa Profunda Gemini

A Pesquisa Profunda resume os resultados de busca do Google em um documento simples e bem-citado. O serviço é útil para estudantes e qualquer um que precise de um resumo rápido de pesquisa. No entanto, sua qualidade não é nem perto da de um paper revisado por pares. A Pesquisa Profunda requer uma assinatura do Google One AI Premium de $19,99.

Meta Llama 3.3 70B

Esta é a versão mais recente e avançada dos modelos de IA de código aberto Llama da Meta. A Meta divulgou essa versão como a mais barata e eficiente até agora, especialmente para matemática, conhecimento geral e seguimento de instruções. É gratuito e de código aberto.

OpenAI Sora

Sora é um modelo que cria vídeos realistas com base em texto. Enquanto pode gerar cenas inteiras em vez de apenas clipes, a OpenAI admite que muitas vezes gera “física irreal”. Atualmente, está disponível apenas em versões pagas do ChatGPT, começando com o Plus, que custa $20 por mês.

Alibaba Qwen QwQ-32B-Preview

Este modelo é um dos poucos que rivalizam com o o1 da OpenAI em certos benchmarks da indústria, se destacando em matemática e codificação. Ironica para um “modelo de raciocínio”, tem “espaço para melhorias em raciocínio de senso comum”, diz a Alibaba. Também incorpora censura do governo chinês, mostram testes do TechCrunch. É gratuito e de código aberto.

Uso de Computador da Anthropic

O Uso de Computador do Claude é destinado a controlar seu computador para completar tarefas como codificação ou reservar um bilhete de avião, tornando-se um predecessor do Operador da OpenAI. O uso do computador, no entanto, permanece em beta. A precificação é via API: $0,80 por milhão de tokens de entrada e $4 por milhão de tokens de saída.

Grok 2 da xAI

A empresa de IA de Elon Musk, xAI, lançou uma versão aprimorada de seu chatbot Grok 2 que afirma ser “três vezes mais rápido”. Usuários gratuitos estão limitados a 10 perguntas a cada duas horas no Grok, enquanto assinantes dos planos Premium e Premium+ do X desfrutam de limites de uso mais altos. A xAI também lançou um gerador de imagens, Aurora, que produz imagens altamente fotorealistas, incluindo algum conteúdo gráfico ou violento.

OpenAI o1

A família o1 da OpenAI é destinada a produzir melhores respostas ao “pensar” através das respostas por meio de uma função de raciocínio oculta. O modelo se destaca em codificação, matemática e segurança, afirma a OpenAI, mas também possui problemas ao tentar enganar humanos. Usar o o1 requer uma assinatura do ChatGPT Plus, que custa $20 por mês.

Claude Sonnet 3.5 da Anthropic

O Claude Sonnet 3.5 é um modelo que a Anthropic afirma ser o melhor de sua classe. Tornou-se conhecido por suas capacidades de codificação e é considerado o chatbot preferido de muitos insiders de tecnologia. O modelo pode ser acessado gratuitamente no Claude, embora usuários intensivos precisem de uma assinatura Pro de $20 por mês. Embora possa entender imagens, não pode gerá-las.

OpenAI GPT 4o-mini

A OpenAI divulgou o GPT 4o-mini como seu modelo mais acessível e rápido até agora, graças ao seu pequeno tamanho. Destina-se a possibilitar uma ampla gama de tarefas, como alimentar chatbots de atendimento ao cliente. O modelo está disponível no nível gratuito do ChatGPT. É mais adequado para tarefas simples de alto volume em comparação com tarefas mais complexas.

Cohere Command R+

O modelo Command R+ da Cohere se destaca em aplicações empresariais complexas de geração aumentada por recuperação (RAG). Isso significa que pode encontrar e citar peças específicas de informação muito bem. (O inventor do RAG realmente trabalha na Cohere.) No entanto, o RAG não resolve completamente o problema da alucinação da IA.


    três × um =

    Bolt42