Bolt42

Participe das nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder da indústria. Saiba Mais


Anthropic acaba de disparar um alerta para OpenAI, DeepSeek e toda a indústria de IA com o lançamento de Claude 3.7 Sonnet, um modelo que dá aos usuários controle sem precedentes sobre quanto tempo a IA passa “pensando” antes de gerar uma resposta. O lançamento, junto com a estreia de Claude Code, um agente de codificação de IA de linha de comando, sinaliza a agressiva entrada da Anthropic no mercado de IA empresarial — uma movimentação que pode reformular como as empresas constroem software e automatizam o trabalho.

Os riscos não poderiam ser maiores. No mês passado, a DeepSeek surpreendeu o mundo da tecnologia com um modelo de IA que igualou as capacidades dos sistemas dos EUA a um custo reduzido, fazendo as ações da Nvidia caírem 17% e levantando alarmes sobre a liderança da IA americana. Agora a Anthropic acredita que o controle preciso sobre o raciocínio da IA — não apenas velocidade bruta ou economia de custos — lhe dará uma vantagem.

Claude 3.7 Sonnet introduz um modo de ‘pensar’, permitindo que os usuários otimizem o tempo de resposta da IA com base na complexidade da tarefa. (Crédito: Anthropic)

“Acreditamos que o raciocínio é uma parte central e um componente fundamental de uma IA, em vez de algo separado que você deve pagar separadamente para acessar”, disse Dianne Penn, que lidera a gestão de produtos para pesquisa na Anthropic, em uma entrevista ao VentureBeat. “Assim como os humanos, a IA deve lidar com respostas rápidas e pensamentos complexos. Para uma pergunta simples como ‘que horas são?’, deve responder instantaneamente. Mas para tarefas complexas — como planejar uma viagem de duas semanas para a Itália, acomodando necessidades alimentares sem glúten — precisa de mais tempo de processamento.”

“Não vemos o raciocínio, o planejamento e a autocorreção como capacidades separadas”, acrescentou. “Então isso é essencialmente nossa maneira de expressar essa diferença filosófica… Idealmente, o modelo deve reconhecer quando um problema exige um pensamento mais intenso e se ajustar, em vez de exigir que os usuários selecionem explicitamente diferentes modos de raciocínio.”

Uma comparação de modelos de IA mostra o desempenho do Claude 3.7 Sonnet em várias tarefas, com ganhos notáveis em capacidades de raciocínio estendido em comparação com seu predecessor. (Crédito: Anthropic)

Os dados de referência respaldam a visão ambiciosa da Anthropic. No modo de pensamento estendido, o Claude 3.7 Sonnet alcança 78,2% de precisão em tarefas de raciocínio em nível de pós-graduação, desafiando os últimos modelos da OpenAI e superando o DeepSeek-R1.

Mas as métricas mais reveladoras vêm de aplicações do mundo real. O modelo obtém 81,2% em uso de ferramentas voltadas para o varejo e mostra melhorias marcadas em seguimento de instruções (93,2%) — áreas onde concorrentes tiveram dificuldades ou não publicaram resultados.

Enquanto DeepSeek e OpenAI lideram em referências tradicionais de matemática, a abordagem unificada do Claude 3.7 demonstra que um único modelo pode efetivamente alternar entre respostas rápidas e análises profundas, potencialmente eliminando a necessidade de as empresas manterem sistemas de IA separados para diferentes tipos de tarefas.

Como a IA híbrida da Anthropic pode reformular a computação empresarial

O timing do lançamento é crucial. O surgimento da DeepSeek no mês passado enviou ondas de choque por Silicon Valley, demonstrando que um raciocínio sofisticado em IA poderia ser alcançado com muito menos poder computacional do que se pensava anteriormente. Isso desafiou suposições fundamentais sobre os custos de desenvolvimento de IA e os requisitos de infraestrutura. Quando a DeepSeek publicou seus resultados, as ações da Nvidia caiu 17% em um só dia, com investidores questionando se chips caros eram verdadeiramente essenciais para a IA avançada.

Para os negócios, os riscos não poderiam ser maiores. As empresas estão gastando milhões para integrar IA em suas operações, apostando em qual abordagem dominará. O modelo híbrido da Anthropic oferece um caminho intermediário convincente: a capacidade de ajustar o desempenho da IA com base na tarefa em questão, desde respostas instantâneas ao cliente até análises financeiras complexas. O sistema mantém o preço anterior da Anthropic de $3 por milhão de tokens de entrada e $15 por milhão de tokens de saída, mesmo com as novas funcionalidades de raciocínio.

Claude 3.7 Sonnet introduz um modo de ‘pensar’, permitindo que os usuários otimizem o tempo de resposta da IA com base na complexidade da tarefa. (Crédito: Anthropic)

“Nossos clientes estão tentando alcançar resultados para seus clientes”, explicou Michael Gerstenhaber, chefe de plataforma da Anthropic. “Usar o mesmo modelo e solicitar de maneiras diferentes permite que uma empresa como Thompson Reuters faça pesquisas jurídicas, permite que nossos parceiros de codificação, como Cursor ou GitHub possam desenvolver aplicações e atingir esses objetivos.”

A abordagem híbrida da Anthropic representa uma evolução técnica e um golpe estratégico. Enquanto a OpenAI mantém modelos separados para diferentes capacidades e a DeepSeek se concentra em eficiência de custo, a Anthropic está buscando sistemas unificados que possam lidar com tarefas rotineiras e raciocínio complexo. É uma filosofia que pode reformular como as empresas implementam IA e eliminar a necessidade de administrar vários modelos especializados.

Conheça Claude Code: o novo assistente de desenvolvedor da IA

A Anthropic também apresentou hoje Claude Code, uma ferramenta de linha de comando que permite aos desenvolvedores delegar tarefas de engenharia complexas diretamente à IA. O sistema requer aprovação humana antes de efetivar alterações de código, refletindo o crescente foco da indústria no desenvolvimento responsável de IA.

A interface de terminal do Claude Code, parte do novo conjunto de ferramentas para desenvolvedores da Anthropic, enfatiza a simplicidade e a interação direta. (Crédito: Anthropic)

“Você ainda precisa aceitar as mudanças que Claude faz. Você é um revisor com a mão na [direção]”, observou Penn. “Existe essencialmente uma lista de verificação que você deve aceitar para o modelo tomar certas ações.”

As novidades surgem em meio a uma intensa concorrência no desenvolvimento de IA. Pesquisadores de Stanford recentemente criaram um modelo de raciocínio de código aberto por menos de $50, enquanto a Microsoft acabou de integrar o modelo o3-mini da OpenAI no Azure. O sucesso da DeepSeek também estimulou novas abordagens para o desenvolvimento de IA, com algumas empresas explorando técnicas de destilação de modelos que podem reduzir ainda mais os custos.

A interface de linha de comando do Claude Code permite que os desenvolvedores deleguem tarefas de engenharia complexas, mantendo a supervisão humana. (Crédito: Anthropic)

De Pokémon a Enterprise: Testando a nova inteligência da IA

Penn ilustrou o progresso dramático nas capacidades de IA com um exemplo inesperado: “Temos pedido a diferentes versões do Claude para jogar Pokémon… Esta versão chegou até Vermilion City, capturou múltiplos Pokémon e até mesmo evolui para níveis superiores. Tem os Pokémon certos para batalhar contra rivais.”

“Acredito que você nos verá continuar inovando e pressionando pela qualidade do raciocínio, avançando para coisas como raciocínio dinâmico”, explicou Penn. “Sempre pensamos nisso como uma parte central da inteligência, em vez de algo separado.”

O verdadeiro teste da abordagem da Anthropic virá da adoção por empresas. Embora jogar Pokémon possa parecer trivial, demonstra o tipo de inteligência adaptativa que os negócios precisam: IA que pode lidar tanto com operações rotineiras quanto com decisões estratégicas complexas sem alternar entre modelos especializados. Versões anteriores do Claude não conseguiam navegar além da cidade inicial do jogo. A versão mais recente constrói estratégias, gerencia recursos e toma decisões táticas — capacidades que refletem a complexidade dos desafios empresariais do mundo real.

Para clientes empresariais, isso pode significar a diferença entre manter vários sistemas de IA para diferentes tarefas e implantar uma única solução mais capaz. Os próximos meses revelarão se a aposta da Anthropic em um raciocínio unificado de IA reformulará o mercado empresarial ou se tornará apenas mais um experimento na rápida evolução da indústria.





    dezesseis − cinco =




    Bolt42