Bolt42

Apresentado pela Nvidia


A ascensão da IA agente

Há mais de uma década, a “IA perceptiva” nos proporcionou modelos que podiam encontrar padrões ou anomalias em dados e fazer previsões. Mas essa inteligência estava ligada a respostas já conhecidas. Esta é uma imagem de um cachorro ou de um gato? É um pedestre atravessando a estrada à minha frente?

Com a “IA generativa”, podemos criar novos conteúdos, nunca vistos antes, moldados por nossos próprios comandos. Em vez de receber uma resposta a uma pergunta já respondida, cada um de nós está criando novos textos, imagens, vozes e vídeos usando todos os dados não estruturados que podemos lançar sobre esses modernos modelos de IA.

A “IA agente” promete “agentes digitais” que aprendem conosco, podem perceber, raciocinar sobre problemas em múltiplas etapas e, então, tomar decisões autônomas em nosso nome. Eles podem resolver questões complexas que exigem interação com muitos outros agentes, formular respostas e executar ações. Considere agentes de previsão na cadeia de suprimentos prevendo as necessidades dos clientes ao interagir com agentes de atendimento ao cliente e, então, ajustando proativamente o estoque do armazém ao envolver agentes de inventário. Cada trabalhador do conhecimento se descobrirá ganhando essas capacidades sobre-humanas, apoiados por uma equipe de agentes de tarefas específicos do domínio, ajudando-os a enfrentar grandes trabalhos complexos com menos esforço despendido.

O crescente problema da “shadow AI”

No entanto, a proliferação da IA generativa, e em breve da IA agente, apresenta um problema crescente para as equipes de TI. Talvez você esteja familiarizado com a “shadow IT”, onde departamentos ou usuários individuais adquirem seus próprios recursos, sem o conhecimento da TI. No mundo de hoje, temos a “shadow AI”, que está atingindo as empresas em dois fronts.

  1. Aplicativos de IA orientados ao consumidor estão proliferando a um ritmo rápido, e muitos trabalhadores do conhecimento empresarial estão os utilizando1, alimentando-os com dados potencialmente sensíveis, propriedade intelectual e dados de clientes, muitas vezes interagindo com serviços que não possuem as devidas seguranças2. Isso está criando um enorme risco de governança para a maioria das empresas.
  2. Muitos desenvolvedores também estão criando seus próprios silos de TI para apoiar seus projetos. A maioria desses silos tem pouco ou nenhum conhecimento sobre o trabalho dos outros, e estão aumentando as despesas operacionais à medida que adquirem computação para projetos de curto prazo, que depois ficam subutilizados ou desperdiçados, juntamente com silos de dados que impedem o fluxo de informações vitais entre as equipes. E talvez o pior de tudo, eles estão perdendo a oportunidade de aprender uns com os outros em termos de compartilhar experiência e melhores práticas para entregar aplicações de IA de forma eficiente.

A fábrica de IA — construída sobre Nvidia DGX alimentado por Blackwell

As empresas de hoje criam valor por meio de insights e respostas impulsionadas pela inteligência, destacando-se de seus concorrentes. Assim como as revoluções industriais transformaram indústrias — pense em vapor, eletricidade, internet e, mais tarde, software de computador — a era da IA anuncia uma nova era em que a produção de inteligência é o núcleo motor de cada negócio. A capacidade de criar essa inteligência digitalizada em grande escala está impulsionando a demanda por um novo tipo de fábrica. Esta “fábrica de IA” é a próxima evolução da infraestrutura empresarial.

Em vez de carvão, eletricidade ou software (os combustíveis das fábricas do passado), as fábricas de IA fabricam modelos de IA para:

  • Reduzir custos operacionais
  • Analisar grandes quantidades de dados e impulsionar inovações
  • Fomentar escala com agilidade
  • Aumentar a produtividade nas empresas

As fábricas de IA agora são a infraestrutura essencial sobre a qual as organizações podem ter seu próprio “centro de excelência” em IA — ou seja, uma plataforma unificada na qual pessoas, processos e infraestrutura podem ser consolidados para obter benefícios-chave, incluindo:

  • Escalonar talentos em IA, com expertise em ciência de dados adquirida internamente, em vez de contratada de fora
  • Padronização de ferramentas e melhores práticas que criam um ciclo de desenvolvimento de aplicativos
  • Maximização da utilização da infraestrutura de computação acelerada que é orquestrada centralmente

Para permitir a era de modelos de linguagem de grande porte (LLMs), IA agente e o que vem a seguir, criamos a plataforma Nvidia DGX para ser o motor que impulsiona as fábricas de IA. As empresas começaram a construir suas plataformas com isso, para habilitar aplicações de ponta que exigem muitos modelos de especialistas diferentes trabalhando em conjunto com latência imperceptível, resolvendo problemas complexos e multilayer.

Sistemas Nvidia DGXTM impulsionados por GPU, com CPUs Intel® Xeon®, integram aceleradores Nvidia Blackwell com uma arquitetura de próxima geração otimizada para a era da IA agente, enquanto oferecem quinze vezes maior rendimento de inferência com doze vezes maior eficiência energética3. Esta plataforma inclui software de gestão de desenvolvedor e infraestrutura de primeira linha que simplifica e acelera o ciclo de vida de desenvolvimento de aplicações, desde o desenvolvimento até a implantação, enquanto apoia o ajuste contínuo do modelo.

Impacto no mundo real agora, não depois

Em uma análise da Nvidia sobre implementadores de fábricas de IA, encontramos muitos benefícios derivados que podem mitigar o impacto da shadow AI, melhorando o tempo para o mercado, produtividade e utilização da infraestrutura — enquanto possibilitam suporte à crescente onda de IA generativa e agente. Essas organizações compartilharam os seguintes benefícios4, conforme expressado por clientes da plataforma Nvidia DGX:

  • Aumento de 6X no desempenho da infraestrutura em comparação com a infraestrutura de TI legada
  • 20% maior produtividade para cientistas de dados e profissionais de IA
  • 90% de utilização da infraestrutura

Tipicamente, esses benefícios têm se limitado a hiperescaladores, que têm décadas de experiência na operação de infraestrutura de alto desempenho, além de um profundo conhecimento na execução de tais plataformas. A realidade é que até mesmo “os especialistas” admitem que suas próprias plataformas muitas vezes não conseguem oferecer as eficiências necessárias, com muitos aceitando 20-30% como o fator de utilização típico4 de sua infraestrutura.

Agora, cada negócio tem a oportunidade de ter uma plataforma de classe hiperescalar para sua própria fábrica de IA, que é mais fácil de adquirir, dramaticamente mais eficiente, mais simples de gerenciar e trazendo benefícios para os negócios agora, e não depois.

Descubra como alcançar insights impulsionados por IA mais rapidamente em sistemas Nvidia DGX™ impulsionados por GPUs Nvidia Tensor Core e processadores Intel® Xeon®..

Tony Paikeday é Diretor Sênior de Marketing de Produto, Sistemas de Inteligência Artificial na Nvidia.


1. “Por que os líderes de TI devem aproveitar a shadow AI para modernizar a governança” Dell Technologies / VentureBeat, Dez 2023

2. ”IA Generativa: Do Buzz ao Valor Comercial”, KPMG, Junho 2023

3. Comparações de testes da NVIDIA de www.nvidia.com/dgx-b200: escala de 32.768 GPU, cluster refrigerado a ar DGX H100 de 4.096x oito vias: rede IB de 400G, cluster refrigerado a ar DGX B200 de 4.096x 8 vias: rede IB de 400G. Desempenho projetado sujeito a alterações.

4. Chowdery, Aakanksha, et al., “PaLM: Escalando Modelagem de Linguagem com Pathways,” arXiv, Outubro 2022.


Artigos patrocinados são conteúdos produzidos por uma empresa que está pagando pelo post ou possui uma relação comercial com a VentureBeat, e estão sempre claramente marcados. Para mais informações, entre em contato com sales@venturebeat.com.


    quatro × 2 =

    Bolt42