Bolt42

Participe dos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de ponta. Saiba mais


Um novo documento da Google, intitulado “Agentes“, planeja um futuro onde a IA desempenha um papel mais ativo e independente nos negócios. Publicado sem muito alarde em setembro, o documento de 42 páginas agora está ganhando atenção no X.com (antigo Twitter) e LinkedIn.

O documento apresenta o conceito de agentes de IA — sistemas de software projetados para ir além dos modelos de IA atuais, raciocinando, planejando e tomando ações com o objetivo de alcançar metas específicas. Ao contrário dos sistemas de IA tradicionais, que geram respostas com base apenas em dados de treinamento pré-existentes, os agentes de IA podem interagir com sistemas externos, tomar decisões e executar tarefas complexas de forma autônoma.

“Os agentes são autônomos e podem atuar independentemente da intervenção humana,” explica o white paper, descrevendo-os como sistemas que combinam raciocínio, lógica e acesso a dados em tempo real. A ideia por trás desses agentes é ambiciosa: eles poderiam ajudar as empresas a automatizar tarefas, resolver problemas e tomar decisões que antes eram feitas exclusivamente por humanos.

Os autores do documento, Julia Wiesinger, Patrick Marlow e Vladimir Vuskovic, oferecem uma análise detalhada de como os agentes de IA funcionam e do que precisam para operar. Mas as implicações mais amplas são igualmente importantes. Os agentes de IA não são apenas um upgrade na tecnologia existente; eles representam uma mudança na forma como as organizações operam, competem e inovam. Empresas que adotarem esses sistemas poderão observar ganhos dramáticos em eficiência e produtividade, enquanto aquelas que hesitarem podem se ver lutando para acompanhar.

A seguir, apresentamos os cinco insights mais importantes do white paper da Google e o que eles podem significar para o futuro da IA nos negócios.

1. Agentes de IA são mais do que apenas modelos mais inteligentes

A Google argumenta que os agentes de IA representam um afastamento fundamental dos modelos tradicionais de linguagem. Enquanto modelos como GPT-4o ou o Gemini da Google se destacam na geração de respostas de uma única vez, eles são limitados ao que aprenderam em seus dados de treinamento. Agentes de IA, por outro lado, são projetados para interagir com sistemas externos, aprender com dados em tempo real e executar tarefas em múltiplas etapas.

“O conhecimento [nos modelos tradicionais] é limitado ao que está disponível em seus dados de treinamento,” nota o documento. “Os agentes estendem esse conhecimento por meio da conexão com sistemas externos via ferramentas.”

Essa diferença não é apenas teórica. Imagine um modelo de linguagem tradicional encarregado de recomendar um itinerário de viagem. Ele pode sugerir ideias com base no conhecimento geral, mas carece da habilidade de reservar voos, verificar a disponibilidade de hotéis ou adaptar suas recomendações com base no feedback do usuário. Um agente de IA, no entanto, pode fazer todas essas coisas, combinando informações em tempo real com decisão autônoma.

Essa mudança posiciona os agentes como um novo tipo de trabalhador digital capaz de lidar com fluxos de trabalho complexos. Para as empresas, isso pode significar automatizar tarefas que anteriormente exigiam múltiplos papéis humanos. Ao integrar raciocínio e execução, os agentes podem se tornar indispensáveis para indústrias que vão desde logística até atendimento ao cliente.

Uma análise de como os agentes de IA usam extensões para acessar APIs externas, como a API de Voos do Google, para execução de tarefas. (Crédito da Imagem: Google)

2. Uma arquitetura cognitiva potencia sua tomada de decisão

No coração das capacidades de um agente de IA está sua arquitetura cognitiva, que a Google descreve como uma estrutura para raciocínio, planejamento e tomada de decisões. Essa arquitetura, conhecida como camada de orquestração, permite que os agentes processem informações em ciclos, incorporando novos dados para refinar suas ações e decisões.

A Google compara esse processo a um chef preparando uma refeição em uma cozinha movimentada. O chef reúne ingredientes, considera as preferências do cliente e adapta a receita conforme necessário com base no feedback ou na disponibilidade dos ingredientes. Da mesma forma, um agente de IA reúne dados, raciocina sobre os próximos passos e ajusta suas ações para alcançar um objetivo específico.

A camada de orquestração depende de técnicas avançadas de raciocínio para guiar a tomada de decisões. Estruturas como razão e ação (ReAct), cadeia de pensamentos (CoT) e árvore de pensamentos (ToT) fornecem métodos estruturados para decompor tarefas complexas. Por exemplo, o ReAct permite que um agente combine raciocínio e ações em tempo real, enquanto o ToT permite que ele explore várias soluções possíveis simultaneamente.

Essas técnicas conferem aos agentes a habilidade de tomar decisões que não são apenas reativas, mas também proativas. Segundo o documento, isso os torna altamente adaptáveis e capazes de gerenciar incertezas e complexidades de maneiras que os modelos tradicionais não conseguem. Para as empresas, isso significa que os agentes poderiam assumir tarefas como solucionar problemas na cadeia de suprimentos ou analisar dados financeiros com um nível de autonomia que reduz a necessidade de supervisão humana constante.

O fluxo do processo de decisão de um agente de IA, desde a entrada do usuário até a execução de ferramentas e respostas finais. (Crédito da Imagem: Google)

Os modelos de IA tradicionais são frequentemente descritos como “bibliotecas estáticas de conhecimento,” limitados ao que foram treinados. Agentes de IA, por outro lado, podem acessar informações em tempo real e interagir com sistemas externos por meio de ferramentas. Essa capacidade é o que os torna práticos para aplicações do mundo real.

“As ferramentas preenchem a lacuna entre as capacidades internas do agente e o mundo externo,” explica o documento. Essas ferramentas incluem APIs, extensões e bancos de dados, que permitem que os agentes busquem informações, executem ações e recuperem conhecimento que evolui ao longo do tempo.

Por exemplo, um agente encarregado de planejar uma viagem de negócios poderia usar uma extensão de API para verificar horários de voos, um banco de dados para recuperar políticas de viagem e uma ferramenta de mapeamento para encontrar hotéis próximos. Essa habilidade de interagir dinamicamente com sistemas externos transforma os agentes de respondentes estáticos em participantes ativos nos processos empresariais.

A Google também destaca a flexibilidade dessas ferramentas. Funções, por exemplo, permitem que os desenvolvedores descarreguem certas tarefas para sistemas do lado do cliente, dando às empresas mais controle sobre como os agentes acessam dados sensíveis ou executam operações específicas. Essa flexibilidade pode ser essencial para indústrias como finanças e saúde, onde conformidade e segurança são críticas.

Uma comparação de controle do lado do agente e controle do lado do cliente, ilustrando como os agentes de IA interagem com ferramentas externas como a API de Voos do Google. (Crédito da Imagem: Google)

4. A geração aumentada por recuperação torna os agentes mais inteligentes

Um dos avanços mais promissores no design de agentes de IA é a integração da geração aumentada por recuperação (RAG). Essa técnica permite que os agentes consultem fontes de dados externas — como bancos de dados vetoriais ou documentos estruturados — quando seus dados de treinamento são insuficientes.

“Os bancos de dados abordam a limitação [dos modelos estáticos] ao fornecer acesso a informações mais dinâmicas e atualizadas,” explica o documento, descrevendo como os agentes podem recuperar dados relevantes em tempo real para fundamentar suas respostas em informações factuais.

Agentes baseados em RAG são particularmente valiosos em campos onde as informações mudam rapidamente. No setor financeiro, por exemplo, um agente poderia pull dados de mercado em tempo real antes de fazer recomendações de investimento. Na saúde, ele poderia recuperar as pesquisas mais recentes para informar sugestões de diagnóstico.

Essa abordagem também aborda um problema persistente na IA: alucinações, ou a geração de informações incorretas ou fabricadas. Ao fundamentar suas respostas em dados do mundo real, os agentes podem melhorar a precisão e a confiabilidade, tornando-os mais adequados para aplicações de alto risco.

Como a geração aumentada por recuperação (RAG) permite que os agentes consultem um banco de dados vetorial e forneçam respostas precisas e contextuais. (Crédito da Imagem: Google)

Embora o white paper esteja repleto de detalhes técnicos, também oferece orientações práticas para empresas que desejam implementar agentes de IA. A Google destaca duas plataformas principais: LangChain, uma estrutura de código aberto para o desenvolvimento de agentes, e Vertex AI, uma plataforma gerenciada para a implementação de agentes em escala.

O LangChain simplifica o processo de construção de agentes, permitindo que os desenvolvedores conectem passos de raciocínio e chamadas de ferramentas. O Vertex AI, por sua vez, oferece recursos como testes, depuração e avaliação de desempenho, tornando mais fácil implantar agentes de qualidade de produção.

“O Vertex AI permite que os desenvolvedores se concentrem em construir e refinar seus agentes enquanto as complexidades da infraestrutura, implantação e manutenção são gerenciadas pela plataforma,” afirma o documento.

Essas ferramentas podem reduzir a barreira de entrada para empresas que desejam experimentar agentes de IA, mas carecem de experiência técnica extensa. No entanto, elas também levantam questões sobre as consequências a longo prazo da adoção generalizada de agentes. À medida que esses sistemas se tornam mais capazes, as empresas precisarão considerar como equilibrar os ganhos de eficiência com possíveis riscos, como dependência excessiva da automação ou preocupações éticas sobre a transparência na tomada de decisões.

A integração de loops de raciocínio, ferramentas e APIs que permitem que os agentes de IA lidem com tarefas complexas, como planejamento de viagens ou consultas de clima. (Crédito da Imagem: Google)

O que tudo isso significa

O white paper da Google sobre agentes de IA é uma visão detalhada e ambiciosa de para onde a IA está se dirigindo. Para as empresas, a mensagem é clara: agentes de IA não são apenas um conceito teórico — eles são uma ferramenta prática que pode remodelar como os negócios operam.

No entanto, essa transformação não acontecerá da noite para o dia. A implementação de agentes de IA requer planejamento cuidadoso, experimentação e disposição para repensar fluxos de trabalho tradicionais. Como o documento observa, “Nenhum dois agentes são criados iguais devido à natureza generativa dos modelos fundamentais que sustentam sua arquitetura.”

Por enquanto, os agentes de IA representam tanto uma oportunidade quanto um desafio. Empresas que investem em entender e implementar essa tecnologia têm a chance de obter uma vantagem significativa. Aqueles que esperam podem se ver correndo atrás em um mundo onde sistemas inteligentes e autônomos estão cada vez mais no controle.





    3 × 1 =




    Bolt42