Bolt42

A Anthropic, um dos maiores fornecedores de IA do mundo, possui uma poderosa família de modelos de IA generativa chamada Claude. Esses modelos podem executar uma variedade de tarefas, desde legendagem de imagens e redação de e-mails até resolução de desafios matemáticos e de programação.

Com o ecossistema de modelos da Anthropic crescendo rapidamente, pode ser difícil acompanhar quais modelos Claude fazem o quê. Para ajudar, compilamos um guia sobre Claude, que vamos manter atualizado à medida que novos modelos e melhorias forem lançados.

Modelos Claude

Os modelos Claude são nomeados em homenagem a obras literárias: Haiku, Soneto e Opus. Os mais recentes são:

  • Claude 3.5 Haiku, um modelo leve.
  • Claude 3.7 Soneto, um modelo híbrido de raciocínio de médio porte. Este é atualmente o modelo de IA principal da Anthropic.
  • Claude 3 Opus, um modelo grande.

Contrariamente ao que se poderia pensar, o Claude 3 Opus — o maior e mais caro modelo que a Anthropic oferece — é, no momento, o modelo Claude com menor capacidade. No entanto, isso deve mudar quando a Anthropic lançar uma versão atualizada do Opus.

Mais recentemente, a Anthropic lançou o Claude 3.7 Soneto, seu modelo mais avançado até agora. Este modelo de IA é diferente do Claude 3.5 Haiku e do Claude 3 Opus porque é um modelo híbrido de raciocínio de IA, que pode fornecer respostas em tempo real e respostas mais consideradas e “pensadas” para perguntas.

Ao usar o Claude 3.7 Soneto, os usuários podem escolher ativar as habilidades de raciocínio do modelo de IA, o que faz com que o modelo “pense” por um curto ou longo período de tempo.

Quando o raciocínio está ativado, o Claude 3.7 Soneto pode levar de alguns segundos a alguns minutos em uma fase de “pensamento” antes de responder. Durante essa fase, o modelo de IA analisa o prompt do usuário, decompõe em partes menores e verifica suas respostas.

O Claude 3.7 Soneto é o primeiro modelo de IA da Anthropic que pode “raciocinar”, uma técnica que muitos laboratórios de IA têm adotado à medida que os métodos tradicionais de melhoria de desempenho da IA vão se esgotando.

Mesmo com seu raciocínio desativado, o Claude 3.7 Soneto continua sendo um dos modelos de IA de melhor desempenho da indústria de tecnologia.

Em novembro, a Anthropic lançou uma versão melhorada – e mais cara – de seu modelo de IA leve, Claude 3.5 Haiku. Este modelo supera o Claude 3 Opus em várias métricas, mas não consegue analisar imagens como o Claude 3 Opus ou o Claude 3.7 Soneto.

Todos os modelos Claude — que possuem uma janela de contexto padrão de 200.000 tokens — também podem seguir instruções em várias etapas, usar ferramentas (por exemplo, rastreadores de ações) e produzir saídas estruturadas em formatos como JSON.

Uma janela de contexto é a quantidade de dados que um modelo como o Claude pode analisar antes de gerar novos dados, enquanto os tokens são partes subdivididas de dados brutos (como as sílabas “fan”, “tas” e “tic” na palavra “fantástico”). Duzentos mil tokens equivalem a cerca de 150.000 palavras, ou um romance de 600 páginas.

Ao contrário de muitos modelos generativos de IA de destaque, os da Anthropic não podem acessar a internet, o que significa que não são particularmente bons em responder perguntas sobre eventos atuais. Eles também não conseguem gerar imagens – apenas diagramas simples.

Quanto às principais diferenças entre os modelos Claude, o Claude 3.7 Soneto é mais rápido que o Claude 3 Opus e entende melhor instruções nuances e complexas. O Haiku tem dificuldades com prompts sofisticados, mas é o mais ágil dos três modelos.

Preços dos modelos Claude

Os modelos Claude estão disponíveis através da API da Anthropic e plataformas gerenciadas como Amazon Bedrock e Google Cloud’s Vertex AI.

Aqui está a tabela de preços da API da Anthropic:

  • Claude 3.5 Haiku custa 80 centavos por milhão de tokens de entrada (~750.000 palavras) ou $4 por milhão de tokens de saída.
  • Claude 3.7 Soneto custa $3 por milhão de tokens de entrada ou $15 por milhão de tokens de saída.
  • Claude 3 Opus custa $15 por milhão de tokens de entrada ou $75 por milhão de tokens de saída.

A Anthropic oferece cache de prompts e processamento em lote para gerar economias adicionais em tempo de execução.

O cache de prompts permite que os desenvolvedores armazenem “contextos de prompt” específicos que podem ser reutilizados em chamadas de API para um modelo, enquanto o processamento em lote processa grupos assíncronos de solicitações de inferência de modelo de baixa prioridade (e, posteriormente, mais baratas).

Planos e aplicativos Claude

Para usuários individuais e empresas que desejam interagir com os modelos Claude via aplicativos para web, Android e iOS, a Anthropic oferece um plano gratuito Claude com limites de taxa e outras restrições de uso.

Atualizar para um dos planos de assinatura da empresa remove esses limites e desbloqueia novas funcionalidades. Os planos atuais são:

Claude Pro, que custa $20 por mês, vem com limites de taxa 5 vezes maiores, acesso prioritário e prévias de recursos futuros.

Voltado para negócios, o Team — que custa $30 por usuário por mês — adiciona um painel de controle para gerenciar cobrança e gestão de usuários, além de integrações com repositórios de dados como bases de código e plataformas de gerenciamento de relacionamento com clientes (por exemplo, Salesforce). Um botão ativa ou desativa citações para verificar reivindicações geradas pela IA. (Como todos os modelos, o Claude às vezes tem alucinações.)

Tanto os assinantes Pro quanto os do Team recebem o recurso Projetos, que fundamenta as saídas do Claude em bases de conhecimento, que podem ser guias de estilo, transcrições de entrevistas, e assim por diante. Esses clientes, juntamente com os usuários do plano gratuito, também podem acessar artefatos, um espaço de trabalho onde os usuários podem editar e adicionar conteúdo como código, aplicativos, designs de sites e outros documentos gerados pelo Claude.

Para clientes que precisam de ainda mais, existe o Claude Enterprise, que permite que as empresas carreguem dados proprietários no Claude para que ele possa analisar as informações e responder perguntas sobre elas. O Claude Enterprise também oferece uma janela de contexto maior (500.000 tokens), integração com o GitHub para equipes de engenharia sincronizarem seus repositórios do GitHub com o Claude, e Projetos e Artefatos.

Uma palavra de cautela

Como acontece com todos os modelos de IA generativa, existem riscos associados ao uso do Claude.

Os modelos ocasionalmente cometem erros ao resumir ou responder perguntas devido à sua tendência de alucinar. Eles também são treinados em dados da web pública, alguns dos quais podem ser protegidos por direitos autorais ou sob uma licença restritiva. A Anthropic e muitos outros fornecedores de IA argumentam que a doutrina do uso justo os protege contra reivindicações de direitos autorais. No entanto, isso não impediu que proprietários de dados entrassem com processos.

A Anthropic oferece políticas para proteger certos clientes de batalhas judiciais decorrentes de desafios de uso justo. No entanto, eles não resolvem o dilema ético de usar modelos treinados em dados sem permissão.

Este artigo foi publicado originalmente em 19 de outubro de 2024. Foi atualizado em 25 de fevereiro de 2025 para incluir novos detalhes sobre o Claude 3.7 Soneto e Claude 3.5 Haiku.



    8 − três =

    Bolt42