Bolt42

Participe das nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de ponta. Saiba mais


A IA Agentic é a mais recente tendência em IA generativa, mas o que vem a seguir?

Embora a inteligência artificial geral (AGI) completa ainda esteja a algum tempo no futuro, pode haver um passo intermediário com uma abordagem conhecida como agentes ambientes.

LangChain, o pioneiro da IA agentic, introduziu o termo “agentes ambientes” em 14 de janeiro. A tecnologia que a LangChain desenvolve inclui seu eponímico framework de código aberto LangChain, que permite que organizações encadeiem diferentes modelos de linguagem de grande porte (LLMs) para obter um resultado. A LangChain Inc. levantou US$ 24 milhões em financiamento em fevereiro de 2024. A empresa também possui uma série de produtos comerciais, incluindo o LangSmith para LLM Ops.

Com uma interface de IA tradicional, os usuários normalmente interagem com um LLM por meio de prompts de texto para iniciar uma ação. A IA agentic geralmente se refere a sistemas movidos por LLM que realizam ações em nome do usuário. O conceito de agentes ambientes leva esse paradigma um passo adiante.

O que são agentes ambientes?

Agentes ambientes são sistemas de IA que operam em segundo plano, monitorando continuamente correntes de eventos e, em seguida, acionados para agir quando apropriado, de acordo com instruções pré-definidas e a intenção do usuário.

Embora o termo “agentes ambientes” seja novo, o conceito de inteligência ambiente, onde a IA está sempre ouvindo, não é. A Amazon se refere à sua tecnologia de assistente pessoal Alexa como habilitando inteligência ambiente.

O objetivo dos agentes ambientes é automatizar tarefas repetitivas e ampliar as capacidades do usuário, tendo múltiplos agentes operando de forma persistente, ao invés de o usuário humano ter que ativá-los e interagir com cada um individualmente. Isso permite que o usuário se concentre em tarefas de nível superior enquanto os agentes cuidam do trabalho rotineiro.

Para ajudar a validar e avançar o conceito de agentes ambientes, a LangChain desenvolveu uma série de casos de uso iniciais, um deles monitora e-mails, enquanto o outro é voltado para redes sociais, para ajudar os usuários a gerenciar e responder quando necessário.

“Acredito que os agentes, de modo geral, são poderosos, emocionantes e legais”, disse Harrison Chase, cofundador e CEO da LangChain, à VentureBeat. “Agentes ambientes são muito mais poderosos se houver vários deles realizando tarefas em segundo plano, você pode escalar seu próprio potencial muito mais.”

A tecnologia se baseia em muitas soluções de código aberto, e a LangChain ainda não indicou quanto cobrará pelo uso de novas ferramentas.

Como os agentes ambientes trabalham para melhorar a usabilidade da IA

Como muitas grandes inovações tecnológicas, a motivação original para os agentes ambientes não era criar um novo paradigma, mas sim resolver um problema real.

Para Chase, o problema é um que é bastante familiar para muitos de nós: sobrecarga da caixa de entrada de e-mails. Chase começou sua jornada para criar agentes ambientes para resolver desafios relacionados ao e-mail. Há seis meses, ele começou a desenvolver um agente ambiente para seu próprio e-mail.

Chase explicou que o assistente de e-mail categoriza seus e-mails, lidando automaticamente com o processo de triagem. Ele não precisa mais manualmente classificar sua caixa de entrada, já que o agente cuida disso. Através do uso contínuo do agente ao longo de um período estendido, Chase foi capaz de refinar e melhorar suas capacidades. Ele observou que começou imperfeito, mas ao usá-lo regularmente e abordar os pontos problemáticos, foi capaz de aprimorar o desempenho do agente.

Para ser claro, o assistente de e-mail não é um sistema simples baseado em regras para classificar e-mails. É um sistema que realmente entende seus e-mails e ajuda ele a decidir como gerenciá-los.

A arquitetura do agente ambiental para o caso de uso do assistente de e-mail

A arquitetura do assistente de e-mail de Chase é bastante complexa, envolvendo múltiplos componentes e modelos de linguagem.

“Começa com uma etapa de triagem que é meio que um LLM e um prompt bastante complicado, além de alguns exemplos curtos que são recuperados semanticamente de um banco de dados vetorial,” explicou Chase. “Então, se for determinado que deve tentar responder, ele vai para um agente de redação.”

Chase explicou ainda que o agente de redação tem acesso a ferramentas adicionais, incluindo um sub-agente especificamente para interagir com o calendário:

“Há um agente que eu tenho especificamente para interagir com o calendário, pois os LLMs têm dificuldades com datas,” disse Chase. “Então eu tive que ter um agente dedicado apenas para interagir com o calendário.”

Após gerar a resposta rascunho, Chase afirmou que há uma chamada LLM adicional que reescreve a resposta para garantir o tom e a formatação corretos.

“Eu percebi que fazer o LLM chamar todas essas ferramentas e construir um e-mail e também escrever no tom correto era realmente complicado, então eu tenho uma etapa explicitamente para o tom,” afirmou Chase.

A caixa de entrada do agente como uma forma de controlar e monitorar agentes

Uma parte crucial da experiência do agente ambiente é ter controle e visibilidade sobre o que os agentes estão fazendo.

Chase notou que em uma implementação inicial, ele apenas fazia os agentes se comunicarem via Slack, mas isso rapidamente se tornou complicado.

Em vez disso, a LangChain projetou uma nova interface de usuário, a caixa de entrada do agente, especificamente para interagir com agentes ambientes.

Captura de tela da caixa de agentes da LangChain. Crédito: VentureBeat

O sistema exibe todas as linhas de comunicação abertas entre usuários e agentes e torna fácil acompanhar as ações pendentes.

Como construir um agente ambiental

A LangChain, antes de mais nada, é uma ferramenta para desenvolvedores e também servirá como uma ferramenta para ajudar a construir e implantar agentes ambientes.

Qualquer desenvolvedor pode usar a tecnologia de código aberto LangChain para construir um agente ambiental, embora ferramentas adicionais possam simplificar o processo. Chase explicou que a caixa de entrada do agente que ele construiu é, de certa forma, uma visualização da plataforma LangGraph. LangGraph é um framework de código aberto para a construção de agentes que fornece a infraestrutura para operar trabalhos de fundo de longa duração.

Além disso, a LangChain está utilizando sua plataforma comercial LangSmith, que fornece observabilidade e avaliação para os agentes. Isso ajuda os desenvolvedores a colocar os agentes em produção com as ferramentas necessárias de monitoramento e avaliação para garantir que eles estão se desempenhando como esperado.

Agentes ambientes: um passo para o uso da inteligência generalizada

Chase está otimista de que o conceito de agentes ambientes irá ganhar força entre os desenvolvedores nos próximos meses e anos.

Agentes ambientes trazem a perspectiva de ainda mais autonomia para a IA, permitindo que ela monitore uma corrente de eventos e tome ações inteligentes. Chase ainda espera que haja necessidade de manter os humanos envolvidos como parte da experiência do agente ambiente. Mas os humanos precisarão apenas confirmar e validar as ações, em vez de descobrir o que precisa ser feito.

“Eu acho que é um passo em direção ao aproveitamento e uso de uma inteligência mais generalizada,” disse Chase.

Chase observou que é mais provável que a verdadeira AGI venha de melhorias nos modelos de raciocínio. Dito isso, tirar melhor proveito dos modelos é onde o conceito de agentes ambientes trará valor.

“Ainda há muito trabalho a ser feito para utilizar os modelos, mesmo depois que eles se tornem realmente inteligentes,” disse Chase. “Acredito que o estilo de interface dos agentes ambientes será absolutamente uma chave para usar essa forma geral de inteligência.”

Uma versão de código aberto do assistente de e-mail está atualmente disponível. A LangChain está lançando hoje um novo agente ambiental voltado para redes sociais, e fará uma versão de código aberto da caixa de entrada do agente disponível na quinta-feira, 16 de janeiro.





    13 + quatro =




    Bolt42