Bolt42

Participe de nossos boletins diários e semanais para obter as últimas atualizações e conteúdo exclusivo sobre a cobertura líder da indústria em inteligência artificial. Saiba Mais


Google Cloud está fazendo uma jogada agressiva para consolidar sua posição no cada vez mais competitivo cenário da inteligência artificial, anunciando uma ampla gama de novas tecnologias focadas em “modelos de raciocínio”, ecossistemas de agentes e infraestrutura especializada projetada especificamente para implantações de IA em larga escala.

Na sua conferência anual Cloud Next em Las Vegas hoje, o Google revelou sua sétima geração de Unidade de Processamento Tensorial (TPU) chamada Ironwood, que a empresa afirma oferecer mais de 42 exaflops de poder computacional por pod — impressionantes 24 vezes mais poderoso do que o principal supercomputador do mundo, El Capitan.

“A oportunidade com a IA é a maior que já existiu,” disse Amin Vahdat, vice-presidente e gerente geral de sistemas de ML e IA em nuvem do Google, durante uma coletiva de imprensa antes do evento. “Junto com nossos clientes, estamos impulsionando uma nova era de inovação.”

A conferência ocorre em um momento crucial para o Google, que tem visto um considerável impulso em seus negócios de nuvem. Em janeiro, a empresa relatou que sua receita de nuvem do Q4 2024 atingiu US$ 12 bilhões, um aumento de 30% em relação ao ano anterior. Os executivos do Google afirmam que usuários ativos no AI Studio e na API Gemini aumentaram em 80% apenas no mês passado.

Como os novos TPUs Ironwood do Google estão transformando a computação em IA com eficiência energética

O Google está se posicionando como o único grande provedor de nuvem com uma “plataforma totalmente otimizada para IA” construída do zero para o que chama de “era da inferência” — onde o foco muda do treinamento de modelo para realmente utilizar sistemas de IA para resolver problemas do mundo real.

O destaque dos anúncios de infraestrutura do Google é o Ironwood, que representa uma mudança fundamental na filosofia de design de chips. Ao contrário das gerações anteriores que equilibravam treinamento e inferência, o Ironwood foi projetado especificamente para executar modelos de IA complexos após serem treinados.

“Não se trata mais dos dados inseridos no modelo, mas do que o modelo pode fazer com os dados após ser treinado,” explicou Vahdat.

Cada pod Ironwood contém mais de 9.000 chips e oferece duas vezes melhor eficiência energética em relação à geração anterior. Esse foco na eficiência aborda uma das preocupações mais urgentes sobre IA generativa: seu enorme consumo de energia.

Além dos novos chips, o Google está abrindo sua imensa infraestrutura de rede global para clientes empresariais através do Cloud WAN (Wide Area Network). Esse serviço torna a rede de fibra de 2 milhões de milhas do Google — a mesma que alimenta serviços consumidores como YouTube e Gmail — disponível para empresas.

Segundo o Google, o Cloud WAN melhora o desempenho da rede em até 40% enquanto reduz simultaneamente o custo total de propriedade na mesma porcentagem em comparação com redes gerenciadas pelo cliente. Isso representa um passo incomum para um hyperscaler, essencialmente transformando sua infraestrutura interna em um produto.

Dentro do Gemini 2.5: como os “modelos de raciocínio” do Google melhoram as aplicações de IA empresarial

No lado do software, o Google está expandindo sua família de modelos Gemini com o Gemini 2.5 Flash, uma versão econômica de seu sistema de IA principal que inclui o que a empresa descreve como “capacidades de raciocínio.”

Diferente dos modelos de linguagem grandes tradicionais que geram respostas diretamente, esses “modelos de raciocínio” decompõem problemas complexos por meio de raciocínio em múltiplas etapas e até reflexões sobre si mesmos. Gemini 2.5 Pro, que foi lançado há duas semanas, é posicionado para casos de uso de alta complexidade como descoberta de medicamentos e modelagem financeira, enquanto a nova variante Flash ajusta sua profundidade de raciocínio com base na complexidade do prompt para equilibrar desempenho e custo.

O Google também está expandindo significativamente suas capacidades de mídia generativa com atualizações para Imagen (para geração de imagens), Veo (vídeo), Chirp (áudio) e a introdução do Lyria, um modelo de texto para música. Durante uma demonstração na coletiva de imprensa, Nenshad Bardoliwalla, Diretor de Gerenciamento de Produto da Vertex AI, mostrou como essas ferramentas poderiam trabalhar juntas para criar um vídeo promocional para um concerto, completo com música personalizada e capacidades de edição sofisticadas, como remover elementos indesejados de clipes de vídeo.

“Apenas o Vertex AI reúne todos esses modelos, juntamente com modelos de terceiros, em uma única plataforma,” disse Bardoliwalla.

Além dos sistemas de IA únicos: como o ecossistema multi-agente do Google visa melhorar os fluxos de trabalho empresariais

Talvez os anúncios mais visionários tenham se concentrado na criação do que o Google chama de um “ecossistema multi-agente” — um ambiente onde múltiplos sistemas de IA podem trabalhar juntos em diferentes plataformas e fornecedores.

O Google está introduzindo um Kit de Desenvolvimento de Agentes (ADK) que permite aos desenvolvedores construir sistemas multi-agente com menos de 100 linhas de código. A empresa também está propondo um novo protocolo aberto chamado Agent2Agent (A2A) que permitiria que agentes de IA de diferentes fornecedores se comunicassem entre si.

“2025 será um ano de transição onde a IA generativa mudará de responder a perguntas únicas para resolver problemas complexos através de sistemas agentes,” previu Vahdat.

Mais de 50 parceiros já se inscreveram para apoiar esse protocolo, incluindo grandes provedores de software empresarial como Salesforce, ServiceNow e SAP, sugerindo uma potencial mudança na indústria em direção a sistemas de IA interoperáveis.

Para usuários não técnicos, o Google está aprimorando sua plataforma Agent Space com recursos como o Agent Gallery (que fornece uma visão única dos agentes disponíveis) e o Agent Designer (uma interface sem código para criar agentes personalizados). Durante uma demonstração, o Google mostrou como um gerente de contas bancárias poderia usar essas ferramentas para analisar portfólios de clientes, prever problemas de fluxo de caixa e redigir automaticamente comunicações para clientes — tudo sem escrever nenhum código.

De resumos de documentos a pedidos no drive-thru: como os agentes especializados em IA do Google estão afetando indústrias

O Google também está integrando profundamente a IA em sua suíte de produtividade Workspace, com novos recursos como “Ajude-me a Analisar” em Planilhas, que identifica automaticamente insights a partir de dados sem fórmulas explícitas ou tabelas dinâmicas, e Visões de Áudio em Documentos, que cria versões de áudio humanóides de documentos.

A empresa destacou cinco categorias de agentes especializados onde está vendo adoção significativa: atendimento ao cliente, trabalho criativo, análise de dados, codificação e segurança.

No âmbito do atendimento ao cliente, o Google destacou o sistema de drive-thru da Wendy’s, que agora lida com 60.000 pedidos diariamente, e o agente “Magic Apron” da Home Depot que oferece orientações sobre melhorias para casa. Para equipes criativas, empresas como WPP estão usando a IA do Google para conceber e produzir campanhas de marketing em escala.

A competição em IA na nuvem se intensifica: como a abordagem abrangente do Google desafia Microsoft e Amazon

Os anúncios do Google ocorrem em meio a uma competição crescente no espaço de IA em nuvem. A Microsoft integrou profundamente a tecnologia da OpenAI em sua plataforma Azure, enquanto a Amazon tem expandido suas ofertas impulsionadas pela Anthropic e chips especializados.

Thomas Kurian, CEO da Google Cloud, enfatizou o compromisso da empresa em “oferecer infraestrutura, modelos, plataformas e agentes de classe mundial; oferecendo uma plataforma multi-nuvem aberta que proporciona flexibilidade e escolha; e construindo para interoperabilidade.”

Essa abordagem multifacetada parece projetada para diferenciar o Google de concorrentes que podem ter forças em áreas específicas, mas não o stack completo de chips a aplicações.

O futuro da IA empresarial: por que os “modelos de raciocínio” do Google e a interoperabilidade são importantes para a tecnologia empresarial

O que torna os anúncios do Google particularmente significativos é a natureza abrangente de sua estratégia de IA, abrangendo silício personalizado, redes globais, desenvolvimento de modelos, estruturas de agentes e integração de aplicações.

O foco na otimização da inferência em vez de apenas nas capacidades de treinamento reflete um mercado de IA maduro. Embora o treinamento de modelos cada vez maiores tenha dominado as manchetes, a capacidade de implantar esses modelos de forma eficiente em larga escala está se tornando o desafio mais urgente para as empresas.

O ênfase do Google na interoperabilidade — permitindo que sistemas de diferentes fornecedores trabalhem juntos — pode também sinalizar uma mudança nas abordagens de jardim murado que caracterizaram fases anteriores da computação em nuvem. Ao propor protocolos abertos como Agent2Agent, o Google está se posicionando como o tecido conectivo em um ecossistema de IA heterogêneo, em vez de exigir uma adoção total.

Para os tomadores de decisão técnica em empresas, esses anúncios apresentam oportunidades e desafios. Os ganhos de eficiência prometidos pela infraestrutura especializada, como os TPUs Ironwood e o Cloud WAN, poderiam reduzir significativamente os custos de implantação da IA em larga escala. No entanto, navegar pelo rapidamente evolutivo cenário de modelos, agentes e ferramentas exigirá um planejamento estratégico cuidadoso.

À medida que esses sistemas de IA mais sofisticados continuam a se desenvolver, a capacidade de orquestrar múltiplos agentes de IA especializados trabalhando em conjunto pode se tornar o principal diferenciador para implementações de IA empresarial. Ao construir tanto os componentes quanto as conexões entre eles, o Google aposta que o futuro da IA não é apenas sobre máquinas mais inteligentes, mas sobre máquinas que podem se comunicar efetivamente entre si.





    quatro × 5 =




    Bolt42