Bolt42

O Google revelou seu primeiro agente de IA que pode realizar ações na web na quarta-feira, um protótipo de pesquisa da divisão DeepMind da empresa chamado Project Mariner. O agente alimentado por Gemini assume o controle do seu navegador Chrome, move o cursor na sua tela, clica em botões e preenche formulários, permitindo que ele use e navegue em sites de maneira semelhante a um humano.

A empresa está começando por liberar seu agente de IA para um pequeno grupo de testadores pré-selecionados na quarta-feira, segundo o Google.

O Google continua a experimentar novas maneiras de fazer com que o Gemini leia, resuma e, agora, use websites. Um executivo do Google disse ao TechCrunch que isso faz parte de uma “mudança de paradigma UX fundamental”: afastar os usuários da interação direta com websites e, em vez disso, interagir com um sistema de IA generativa que faz isso por você.

Uma primeira olhada no Project Mariner (Crédito da Imagem: Google)

Essas mudanças podem afetar milhões de negócios – de publicadores como o TechCrunch a varejistas como o Walmart – que historicamente dependem do Google para enviar pessoas reais para visitar e usar seus sites.

Em uma demonstração com o TechCrunch, a Diretora do Google Labs, Jaclyn Konzelmann, mostrou como o Project Mariner funciona.

Depois de configurar o agente de IA com uma extensão no Chrome, uma janela de chat aparece à direita do seu navegador. Você pode instruir o agente a fazer coisas como “criar um carrinho de compras de um supermercado com base nesta lista”.

Veja como o Project Mariner se parece quando está em uso (Crédito da Imagem: Google)

A partir daí, o agente de IA navegou até o site de um supermercado – neste caso, o Safeway – e então procurou e adicionou itens a um carrinho de compras virtual. Uma coisa que é imediatamente evidente é a lentidão do agente – havia cerca de 5 segundos de atraso entre cada movimento do cursor. Às vezes, o agente parava sua tarefa e voltava para a janela de chat, pedindo esclarecimentos sobre certos itens (quantas cenouras, etc.).

O agente do Google não pode finalizar a compra, pois não deve preencher números de cartões de crédito ou informações de cobrança. O Project Mariner também não aceitará cookies para os usuários, nem assinará um contrato de termos de serviço. O Google afirma que não permite que o agente faça essas coisas intencionalmente, para dar mais controle aos usuários.

Nos bastidores, o agente do Google está tirando screenshots da sua janela do navegador, algo que os usuários devem aceitar nos termos de serviço, e enviando-as para o Gemini na nuvem para processamento. O Gemini então envia instruções de volta ao seu computador para navegar na página da web.

O Project Mariner também pode ser usado para encontrar voos e hotéis, comprar itens de casa, encontrar receitas e outras tarefas que atualmente requerem que os usuários cliquem pela web.

Uma grande ressalva é que o Project Mariner funciona apenas na aba ativa do navegador Chrome, o que significa que você não pode usar seu computador para outras coisas enquanto o agente trabalha em segundo plano – você precisa assistir ao Gemini clicando lentamente. O Diretor de Tecnologia da Google DeepMind, Koray Kavukcuoglu, diz que essa foi uma decisão muito intencional para que os usuários saibam o que o agente de IA do Google está fazendo.

“Porque [o Gemini] agora está realizando ações em nome do usuário, é importante tomar essa abordagem passo a passo,” disse Kavukcuoglu em uma entrevista ao TechCrunch. “É complementar. Você, como indivíduo, pode usar websites, e agora seu agente pode fazer tudo o que você faz em um website também.”

Os proprietários de sites podem ficar aliviados ao saber que o agente de IA do Google opera na tela do seu computador, pois isso significa que publicadores e varejistas ainda conseguem sua atenção em suas páginas. No entanto, o agente de IA do Google pode significar que os usuários estão menos engajados com os sites que visitam, e um dia, pode não ser necessário que os usuários usem esses sites.

“[Project Mariner] é uma mudança de paradigma UX fundamental que estamos vendo agora,” Konzelmann disse ao TechCrunch. “Precisamos descobrir qual é a maneira certa para tudo isso mudar a forma como os usuários interagem com a web, e a maneira como os publicadores podem criar experiências para os usuários, bem como para os agentes, no futuro.”

Além do Project Mariner, o Google também apresentou vários outros agentes de IA para tarefas mais específicas na quarta-feira.

Um agente de IA, Deep Research, tem como objetivo ajudar os usuários a explorar tópicos complexos criando planos de pesquisa em várias etapas. Parece competir com o o1 da OpenAI, que também pode realizar raciocínio em várias etapas. No entanto, um porta-voz do Google observa que o agente não foi projetado para resolver problemas matemáticos e de raciocínio lógico, escrever código ou realizar análise de dados. O agente de IA está sendo lançado no Gemini Advanced hoje e chegará ao aplicativo Gemini em 2025.

Quando solicitado com uma pergunta difícil ou grande, o Deep Research criará um plano de ação em várias etapas para respondê-la. Após o usuário aprovar o plano, o Deep Research leva alguns minutos para responder à pergunta e pesquisar na web, e então gera um relatório extenso sobre suas descobertas.

Outro novo agente de IA do Google, Jules, visa ajudar os desenvolvedores com tarefas de codificação. Ele se integra diretamente aos fluxos de trabalho do GitHub, permitindo que Jules veja seu trabalho existente e faça alterações diretamente no GitHub. Jules está sendo lançado para um grupo selecionado de testadores beta hoje e estará disponível mais tarde em 2025.

Por fim, o Google DeepMind diz que está trabalhando em um agente de IA para ajudar você a navegar em videogames, baseando-se em sua longa história de criação de IA para jogos. O Google está colaborando com desenvolvedores de jogos, como a Supercell, para testar a capacidade do Gemini de interpretar mundos de jogos como “Clash of Clans.” O Google não ofereceu uma data de lançamento para este protótipo, mas afirma que esse trabalho está ajudando a construir agentes de IA que ajudam a navegar em mundos físicos, bem como virtuais.

Não está claro quando o Project Mariner será lançado para a enorme base de usuários do Google, mas quando isso acontecer, esses agentes terão um impacto significativo na web mais ampla. A web é projetada para humanos a utilizarem, mas os agentes de IA do Google podem mudar esse padrão.


    3 × 1 =

    Bolt42