Bolt42

Modelos de IA estão sendo desenvolvidos a uma velocidade alucinante, por todos, desde grandes empresas de tecnologia como Google até startups como OpenAI e Anthropic. Acompanhar os mais recentes pode ser sobrecarregante.

Para complicar ainda mais, os modelos de IA são frequentemente promovidos com base em benchmarks da indústria. Mas essas métricas técnicas revelam pouco sobre como as pessoas e as empresas realmente os utilizam.

Para cortar o ruído, o TechCrunch compilou uma visão geral dos modelos de IA mais avançados lançados desde 2024, com detalhes sobre como usá-los e para que são melhores. Este lista será atualizada com os últimos lançamentos também.

Existem literalmente mais de um milhão de modelos de IA disponíveis: HuggingFace, por exemplo, hospeda mais de 1,4 milhão. Portanto, esta lista pode deixar de fora alguns modelos que apresentam desempenho superior, de alguma forma.

Modelos de IA lançados em 2025

OpenAI o3-mini

Este é o modelo mais recente de raciocínio da OpenAI e é otimizado para tarefas relacionadas a STEM, como codificação, matemática e ciências. Não é o modelo mais poderoso da OpenAI, mas como é menor, a empresa afirma que é significativamente mais barato. Está disponível gratuitamente, mas requer uma assinatura para usuários frequentes.

OpenAI Deep Research

A pesquisa profunda da OpenAI foi projetada para realizar pesquisas detalhadas sobre um tópico com citações claras. Este serviço está disponível apenas com a assinatura Pro do ChatGPT de $200 por mês. A OpenAI recomenda para tudo, desde ciência até pesquisa de compras, mas cuidado, pois as alucinações permanecem um problema para a IA.

Mistral Le Chat

A Mistral lançou versões de aplicativo do Le Chat, um assistente pessoal de IA multimodal. A Mistral afirma que o Le Chat responde mais rapidamente do que qualquer outro chatbot. Também possui uma versão paga com jornalismo atualizado da AFP. Testes do Le Monde descobriram que o desempenho do Le Chat foi impressionante, embora tenha cometido mais erros que o ChatGPT.

OpenAI Operator

O Operator da OpenAI destina-se a ser um estagiário pessoal que pode fazer coisas de forma independente, como ajudar você a fazer compras. Requer uma assinatura Pro do ChatGPT de $200 por mês. Os agentes de IA têm um grande potencial, mas ainda estão experimentais: um revisor do Washington Post afirmou que o Operator decidiu sozinho pedir uma dúzia de ovos por $31, pagando com o cartão de crédito do revisor.

Google Gemini 2.0 Pro Experimental

O tão aguardado modelo flagship do Google Gemini afirma que se destaca em codificação e compreensão de conhecimento geral. Também possui uma super janela de contexto de 2 milhões de tokens, ajudando usuários que precisam processar rapidamente grandes blocos de texto. O serviço requer, no mínimo, uma assinatura do Google One AI Premium de $19,99 por mês.

Modelos de IA lançados em 2024

DeepSeek R1

Este modelo de IA chinês causou furor no Vale do Silício. O R1 do DeepSeek se destaca em codificação e matemática, enquanto sua natureza de código aberto significa que qualquer pessoa pode executá-lo localmente. Além disso, é gratuito. No entanto, o R1 integra a censura do governo chinês e enfrenta proibições crescentes por potencialmente enviar dados do usuário de volta para a China.

Gemini Deep Research

A Pesquisa Profunda resume os resultados de busca do Google em um documento simples e bem citado. O serviço é útil para estudantes e qualquer outra pessoa que precise de um resumo de pesquisa rápido. No entanto, sua qualidade não é nem de longe tão boa quanto um artigo revisado por pares. A Pesquisa Profunda requer uma assinatura do Google One AI Premium de $19,99.

Meta Llama 3.3 7B

Esta é a versão mais nova e avançada dos modelos de IA de código aberto Llama da Meta. A Meta destacou esta versão como a mais barata e eficiente até agora, especialmente para matemática, conhecimento geral e seguimento de instruções. É gratuita e de código aberto.

OpenAI Sora

Sora é um modelo que cria vídeos realistas com base em texto. Embora possa gerar cenas inteiras em vez de apenas clipes, a OpenAI admite que frequentemente gera “física irreal”. Está atualmente disponível apenas nas versões pagas do ChatGPT, começando com a Plus, que custa $20 por mês.

Alibaba Qwen QwQ-32B-Preview

Este modelo é um dos poucos que rivaliza com o o1 da OpenAI em certos benchmarks da indústria, destacando-se em matemática e codificação. Ironicamente, para um ‘modelo de raciocínio’, ele tem “margem para melhorar no raciocínio de senso comum”, afirma a Alibaba. Também incorpora a censura do governo chinês, mostram testes do TechCrunch. É gratuito e de código aberto.

Anthropic’s Computer Use

O Uso de Computador do Claude é projetado para assumir o controle do seu computador para concluir tarefas como codificação ou reservar um bilhete de avião, tornando-se um predecessor do Operator da OpenAI. O uso de computador, no entanto, permanece em beta. O preço é via API: $0,80 por milhão de tokens de entrada e $4 por milhão de tokens de saída.

x.AI’s Grok 2

A x.AI, a empresa de IA de propriedade de Elon Musk, lançou uma versão aprimorada do seu chatbot Grok 2, que afirma ser “três vezes mais rápido”. Usuários gratuitos estão limitados a 10 perguntas a cada duas horas no Grok, enquanto assinantes dos planos Premium e Premium+ do X desfrutam de limites de uso mais altos. A x.AI também lançou um gerador de imagens, Aurora, que produz imagens altamente fotorrealistas, incluindo alguns conteúdos gráficos ou violentos.

OpenAI o1

A família o1 da OpenAI destina-se a produzir melhores respostas ao “pensar” nas respostas por meio de uma função de raciocínio oculta. O modelo brilha em codificação, matemática e segurança, afirma a OpenAI, mas também apresenta problemas em enganar os humanos. O o1 requer assinatura do ChatGPT Plus, que custa $20 por mês.

Anthropic’s Claude Sonnet 3.5

O Claude Sonnet 3.5 é um modelo que a Anthropic reclama ser o melhor da categoria. Tornou-se conhecido por suas capacidades de codificação e é considerado o chatbot preferido entre os insiders da tecnologia. O modelo pode ser acessado gratuitamente no Claude, embora usuários frequentes necessitem de uma assinatura Pro de $20 por mês. Embora possa entender imagens, não consegue gerá-las.

OpenAI GPT 4o-mini

A OpenAI promove o GPT 4o-mini como seu modelo mais acessível e rápido até agora, graças ao seu pequeno tamanho. Destina-se a possibilitar uma ampla gama de tarefas, como alimentar chatbots de atendimento ao cliente. O modelo está disponível na camada gratuita do ChatGPT. É mais adequado para tarefas simples de alto volume em comparação com tarefas mais complexas.

Cohere Command R+

O modelo Command R+ da Cohere se destaca em aplicações complexas de Geração Aumentada por Recuperação (ou RAG) para empresas. Isso significa que pode encontrar e citar peças específicas de informação muito bem. (O inventor da RAG trabalha na Cohere.) No entanto, a RAG não resolve completamente o problema das alucinações da IA.


    dois × um =

    Bolt42