Bolt42


Junte-se às nossas newsletters diárias e semanais para receber as últimas atualizações e conteúdo exclusivo sobre cobertura de IA líder na indústria. Saiba Mais

As empresas que buscam implantar múltiplos agentes de IA frequentemente precisam implementar uma estrutura para gerenciá-los.

Com esse propósito, pesquisadores da Microsoft recentemente revelaram uma nova infraestrutura multi-agente chamada Magnetic-One, que permite a um único modelo de IA alimentar vários agentes auxiliares que trabalham juntos para concluir tarefas complexas e em várias etapas em diferentes cenários. A Microsoft descreve o Magnetic-One como um sistema agentic generalista que pode “realizar completamente a visão de longa data de sistemas agênticos que podem aumentar nossa produtividade e transformar nossas vidas.”

A estrutura é open-source e está disponível para pesquisadores e desenvolvedores, incluindo para fins comerciais, sob uma Licença Microsoft personalizada. Juntamente com o lançamento do Magnetic-One, a Microsoft também lançou uma ferramenta de avaliação de agentes open-source chamada AutoGenBench para testar sistemas agênticos, construída sobre seu framework previamente lançado, Autogen, para comunicação e cooperação entre múltiplos agentes.

A ideia por trás dos sistemas agênticos generalistas é descobrir como agentes autônomos podem resolver tarefas que requerem várias etapas para serem concluídas, tarefas frequentemente encontradas na gestão do dia a dia de uma organização ou até mesmo na vida diária de um indivíduo.

A partir dos exemplos fornecidos pela Microsoft, parece que a empresa espera que o Magnetic-One cumpra tarefas quase mundanas. Os pesquisadores apontaram o Magnetic-One para tarefas como descrever tendências no S&P 500, encontrar e exportar citações faltantes, e até mesmo pedir um shawarma.

Como o Magnetic-One funciona

O Magnetic-One utiliza um agente orquestrador que direciona quatro outros agentes. O Orquestrador não apenas gerencia os agentes, direcionando-os para executar tarefas específicas, mas também os redireciona em caso de erros.

A estrutura é composta por quatro tipos de agentes, além do Orquestrador:

  • Agentes Websurfer: podem comandar navegadores baseados em Chromium e navegar para websites ou realizar buscas na web. Também podem clicar e digitar, semelhante ao Computer Use da Anthropic, e resumir conteúdo.
  • Agentes FileSurfer: leem arquivos locais, listam diretórios e navegam por pastas.
  • Agentes Coder: escrevem códigos, analisam informações de outros agentes e criam novos artefatos.
  • TerminalComputador: fornece um console onde os programas do agente Coder podem ser executados.

O Orquestrador dirige esses agentes e rastreia seu progresso. Ele começa planejando como abordar a tarefa. Cria o que os pesquisadores da Microsoft chamam de livro de tarefas que acompanha o fluxo de trabalho. À medida que a tarefa avança, o Orquestrador constrói um livro de progresso “onde se reflete sobre o progresso da tarefa e verifica se a tarefa foi concluída.” O Orquestrador pode designar um agente para concluir cada tarefa ou atualizar o livro de tarefas. Se os agentes estiverem parados, o Orquestrador pode criar um novo plano.

“Conjuntamente, os agentes do Magnetic-One fornecem ao Orquestrador as ferramentas e capacidades que ele precisa para resolver uma ampla variedade de problemas em aberto, bem como a capacidade de se adaptar e agir autonomamente em ambientes dinâmicos de web e sistema de arquivos que estão em constante mudança”, escreveram os pesquisadores no artigo.

Embora a Microsoft tenha desenvolvido o Magnetic-One usando o GPT-4o da OpenAI — afinal, a OpenAI é um investimento da Microsoft — ele é agnóstico em relação a LLMs, embora os pesquisadores “recomendem um modelo de raciocínio forte para o agente Orquestrador, como o GPT-4o.”

O Magnetic-One suporta múltiplos modelos por trás dos agentes, por exemplo, os desenvolvedores podem implantar um LLM de raciocínio para o agente Orquestrador e uma mistura de outros LLMs ou pequenos modelos de linguagem para os diferentes agentes. Os pesquisadores da Microsoft experimentaram uma configuração diferente do Magnetic-One “usando a versão 01-preview da OpenAI para o laço externo do Orquestrador e para o Coder, enquanto outros agentes continuaram a usar o GPT-4o.”

A próxima etapa em frameworks agênticos

Os sistemas agênticos estão se tornando mais populares à medida que mais opções para implantar agentes, desde bibliotecas de agentes prontas até agentes personalizáveis específicos da organização, estão surgindo. A Microsoft anunciou seu próprio conjunto de agentes de IA para a plataforma Dynamics 365 em outubro.

As empresas de tecnologia agora estão começando a competir em frameworks de orquestração de IA, particularmente sistemas que gerenciam fluxos de trabalho agênticos. A OpenAI lançou seu framework Swarm, que oferece aos desenvolvedores uma maneira simples, mas flexível, de permitir que agentes orientem a colaboração agêntica. O construtor multi-agente da CrewAI também oferece uma maneira de gerenciar agentes. Enquanto isso, a maioria das empresas tem confiado no LangChain para ajudar a construir frameworks agênticos.

No entanto, a implantação de agentes de IA nas empresas ainda está em seus estágios iniciais, portanto, descobrir o melhor framework multi-agente continuará a ser um experimento contínuo. A maioria dos agentes de IA ainda atua em seu próprio espaço em vez de se comunicar com agentes de outros sistemas. À medida que mais empresas começam a usar agentes de IA, gerenciar essa expansão e garantir que os agentes de IA transfiram o trabalho suavemente entre si para concluir tarefas se torna mais crucial.

VB Diário

Mantenha-se informado! Receba as últimas notícias em sua caixa de entrada diariamente.

Ao assinar, você concorda com os Termos de Serviço da VentureBeat.

Obrigado por se inscrever. Confira mais newsletters da VB aqui.

Ocorreu um erro.

    doze + dez =

    Bolt42