Junte-se às nossas newsletters diárias e semanais para receber as últimas atualizações e conteúdo exclusivo sobre cobertura de IA líder na indústria. Saiba Mais
As empresas que buscam implantar múltiplos agentes de IA frequentemente precisam implementar uma estrutura para gerenciá-los.
Com esse propósito, pesquisadores da Microsoft recentemente revelaram uma nova infraestrutura multi-agente chamada Magnetic-One, que permite a um único modelo de IA alimentar vários agentes auxiliares que trabalham juntos para concluir tarefas complexas e em várias etapas em diferentes cenários. A Microsoft descreve o Magnetic-One como um sistema agentic generalista que pode “realizar completamente a visão de longa data de sistemas agênticos que podem aumentar nossa produtividade e transformar nossas vidas.”
A estrutura é open-source e está disponível para pesquisadores e desenvolvedores, incluindo para fins comerciais, sob uma Licença Microsoft personalizada. Juntamente com o lançamento do Magnetic-One, a Microsoft também lançou uma ferramenta de avaliação de agentes open-source chamada AutoGenBench para testar sistemas agênticos, construída sobre seu framework previamente lançado, Autogen, para comunicação e cooperação entre múltiplos agentes.
A ideia por trás dos sistemas agênticos generalistas é descobrir como agentes autônomos podem resolver tarefas que requerem várias etapas para serem concluídas, tarefas frequentemente encontradas na gestão do dia a dia de uma organização ou até mesmo na vida diária de um indivíduo.
A partir dos exemplos fornecidos pela Microsoft, parece que a empresa espera que o Magnetic-One cumpra tarefas quase mundanas. Os pesquisadores apontaram o Magnetic-One para tarefas como descrever tendências no S&P 500, encontrar e exportar citações faltantes, e até mesmo pedir um shawarma.
Como o Magnetic-One funciona
O Magnetic-One utiliza um agente orquestrador que direciona quatro outros agentes. O Orquestrador não apenas gerencia os agentes, direcionando-os para executar tarefas específicas, mas também os redireciona em caso de erros.
A estrutura é composta por quatro tipos de agentes, além do Orquestrador:
- Agentes Websurfer: podem comandar navegadores baseados em Chromium e navegar para websites ou realizar buscas na web. Também podem clicar e digitar, semelhante ao Computer Use da Anthropic, e resumir conteúdo.
- Agentes FileSurfer: leem arquivos locais, listam diretórios e navegam por pastas.
- Agentes Coder: escrevem códigos, analisam informações de outros agentes e criam novos artefatos.
- TerminalComputador: fornece um console onde os programas do agente Coder podem ser executados.
O Orquestrador dirige esses agentes e rastreia seu progresso. Ele começa planejando como abordar a tarefa. Cria o que os pesquisadores da Microsoft chamam de livro de tarefas que acompanha o fluxo de trabalho. À medida que a tarefa avança, o Orquestrador constrói um livro de progresso “onde se reflete sobre o progresso da tarefa e verifica se a tarefa foi concluída.” O Orquestrador pode designar um agente para concluir cada tarefa ou atualizar o livro de tarefas. Se os agentes estiverem parados, o Orquestrador pode criar um novo plano.
“Conjuntamente, os agentes do Magnetic-One fornecem ao Orquestrador as ferramentas e capacidades que ele precisa para resolver uma ampla variedade de problemas em aberto, bem como a capacidade de se adaptar e agir autonomamente em ambientes dinâmicos de web e sistema de arquivos que estão em constante mudança”, escreveram os pesquisadores no artigo.
Embora a Microsoft tenha desenvolvido o Magnetic-One usando o GPT-4o da OpenAI — afinal, a OpenAI é um investimento da Microsoft — ele é agnóstico em relação a LLMs, embora os pesquisadores “recomendem um modelo de raciocínio forte para o agente Orquestrador, como o GPT-4o.”
O Magnetic-One suporta múltiplos modelos por trás dos agentes, por exemplo, os desenvolvedores podem implantar um LLM de raciocínio para o agente Orquestrador e uma mistura de outros LLMs ou pequenos modelos de linguagem para os diferentes agentes. Os pesquisadores da Microsoft experimentaram uma configuração diferente do Magnetic-One “usando a versão 01-preview da OpenAI para o laço externo do Orquestrador e para o Coder, enquanto outros agentes continuaram a usar o GPT-4o.”
A próxima etapa em frameworks agênticos
Os sistemas agênticos estão se tornando mais populares à medida que mais opções para implantar agentes, desde bibliotecas de agentes prontas até agentes personalizáveis específicos da organização, estão surgindo. A Microsoft anunciou seu próprio conjunto de agentes de IA para a plataforma Dynamics 365 em outubro.
As empresas de tecnologia agora estão começando a competir em frameworks de orquestração de IA, particularmente sistemas que gerenciam fluxos de trabalho agênticos. A OpenAI lançou seu framework Swarm, que oferece aos desenvolvedores uma maneira simples, mas flexível, de permitir que agentes orientem a colaboração agêntica. O construtor multi-agente da CrewAI também oferece uma maneira de gerenciar agentes. Enquanto isso, a maioria das empresas tem confiado no LangChain para ajudar a construir frameworks agênticos.
No entanto, a implantação de agentes de IA nas empresas ainda está em seus estágios iniciais, portanto, descobrir o melhor framework multi-agente continuará a ser um experimento contínuo. A maioria dos agentes de IA ainda atua em seu próprio espaço em vez de se comunicar com agentes de outros sistemas. À medida que mais empresas começam a usar agentes de IA, gerenciar essa expansão e garantir que os agentes de IA transfiram o trabalho suavemente entre si para concluir tarefas se torna mais crucial.
VB Diário
Mantenha-se informado! Receba as últimas notícias em sua caixa de entrada diariamente.
Ao assinar, você concorda com os Termos de Serviço da VentureBeat.
Obrigado por se inscrever. Confira mais newsletters da VB aqui.
Ocorreu um erro.
Conteúdo relacionado
Hugging Face afirma que seu novo modelo de robótica é tão eficiente que pode rodar em um MacBook.
[the_ad id="145565"] Está se tornando um pouco mais fácil criar projetos sofisticados de robótica em casa. No início desta semana, a plataforma de desenvolvimento de IA Hugging…
A Nova Tecnologia de Auto-Rotulação da Voxel51 Promete Reduzir Custos de Anotação em 100.000x
[the_ad id="145565"] Um estudo inovador da startup de visão computacional Voxel51 sugere que o modelo tradicional de anotação de dados está prestes a ser revolucionado. Em uma…
Rosebud capta US$ 6 milhões para expandir seu aplicativo de journaling interativo com IA
[the_ad id="145565"] O aplicativo de journaling Rosebud levantou US$ 6 milhões em financiamento seed enquanto busca aprimorar seu aplicativo como um mentor de IA para…