Junte-se às nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder na indústria. Saiba mais
A pressão da indústria em direção à IA agente continua, com a Nvidia anunciando vários novos serviços e modelos para facilitar a criação e a implementação de agentes de IA.
Hoje, a Nvidia lançou o Nemotron, uma família de modelos baseada no Llama da Meta e treinada nas técnicas e conjuntos de dados da empresa. A companhia também anunciou novos blueprints de orquestração de IA para guiar os agentes de IA. Esses últimos lançamentos colocam a Nvidia, uma empresa mais conhecida pelo hardware que alimenta a revolução da IA generativa, na vanguarda do desenvolvimento de IA agente.
O Nemotron vem em três tamanhos: Nano, Super e Ultra. Também está disponível em dois formatos: o Llama Nemotron para tarefas de linguagem e o Cosmos Nemotron, um modelo de visão para projetos de IA física. O Llama Nemotron Nano possui 4B de parâmetros, o Super 49B de parâmetros e o Ultra 253B de parâmetros.
Todos os três modelos funcionam melhor para tarefas de agentes, incluindo “seguimento de instruções, chat, chamada de funções, programação e matemática”, de acordo com a empresa.
Rev Lebaredian, VP de Omniverse e tecnologia de simulação da Nvidia, disse em uma coletiva de imprensa com jornalistas que os três tamanhos são otimizados para diferentes recursos computacionais da Nvidia. O Nano é para aplicações de baixa latência e custo eficiente em dispositivos de PC e edge, o Super é para alta precisão e rendimento em uma única GPU, e o Ultra é para máxima precisão em escala de data center.
“Agentes de IA são a força de trabalho digital que trabalhará para nós e conosco, portanto, a família de modelos Nemotron é destinada à IA agente,” afirmou Lebaredian.
Os modelos Nemotron estão disponíveis como APIs hospedadas no Hugging Face e no site da Nvidia. A Nvidia informou que as empresas podem acessar os modelos por meio da sua plataforma de software AI Enterprise.
A Nvidia não é estranha a modelos fundacionais. No ano passado, lançou discretamente uma versão do Nemotron, o Llama-3.1-Nemotron-70B-Instruct, que superou modelos semelhantes da OpenAI e da Anthropic. Também apresentou o NVLM 1.0, uma família de modelos de linguagem multimodal.
Mais suporte para agentes
Os agentes de IA se tornaram uma grande tendência em 2024, à medida que as empresas começaram a explorar como implantar sistemas agentes em seu fluxo de trabalho. Muitos acreditam que esse impulso continuará neste ano.
Empresas como Salesforce, ServiceNow, AWS e Microsoft chamaram os agentes de a próxima onda de IA generativa nas empresas. A AWS adicionou orquestração multiagente ao Bedrock, enquanto a Salesforce lançou sua Agentforce 2.0, trazendo mais agentes para seus clientes.
No entanto, os fluxos de trabalho agentes ainda precisam de outra infraestrutura para funcionar de forma eficiente. Uma dessas infraestruturas gira em torno da orquestração, ou seja, do gerenciamento de múltiplos agentes atravessando diferentes sistemas.
Blueprints de orquestração
A Nvidia também entrou no campo emergente da orquestração de IA com seus blueprints que guiam os agentes em tarefas específicas.
A empresa fez parceria com várias empresas de orquestração, incluindo LangChain, LlamaIndex, CrewAI, Daily e Weights and Biases, para construir blueprints na Nvidia AI Enterprise. Cada framework de orquestração desenvolveu seu próprio blueprint com a Nvidia. Por exemplo, a CrewAI criou um blueprint para documentação de código para garantir que repositórios de código sejam fáceis de navegar. O LangChain adicionou microserviços Nvidia NIM ao seu blueprint de geração de relatórios estruturados para ajudar os agentes a retornarem buscas na internet em diferentes formatos.
“Fazer com que múltiplos agentes trabalhem juntos de maneira suave, ou orquestração, é fundamental para a implementação da IA agente,” disse Lebaredian. “Essas principais empresas de orquestração de IA estão integrando todos os blocos de construção de agentes da Nvidia, NIM, Nemo e Blueprints com suas plataformas de orquestração de agentes de código aberto.”
O novo blueprint PDF-para-podcast da Nvidia visa competir com o NotebookLM do Google, convertendo informações de PDFs em áudio. Outro novo blueprint ajudará a construir agentes para pesquisar e resumir vídeos.
Lebaredian disse que os Blueprints têm como objetivo ajudar os desenvolvedores a implantar rapidamente agentes de IA. Para isso, a Nvidia apresentou o Nvidia Launchables, uma plataforma que permite aos desenvolvedores testar, prototipar e executar blueprints com um clique.
A orquestração pode ser uma das histórias mais importantes de 2025, à medida que as empresas lidam com produção de múltiplos agentes.
Se você quer impressionar seu chefe, o VB Daily tem o que você precisa. Nós fornecemos informações sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights para um ROI máximo.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais newsletters do VB aqui.
Ocorreu um erro.
Conteúdo relacionado
Little Umbrella faz a chuva de investimentos após o sucesso do jogo social Death by AI
[the_ad id="145565"] Inscreva-se em nossos boletins diários e semanais para ficar por dentro das últimas atualizações e conteúdos exclusivos sobre a cobertura de IA de ponta.…
A OpenAI oferecerá sua tecnologia para laboratórios nacionais dos EUA para pesquisa em armas nucleares.
[the_ad id="145565"] A OpenAI anunciou que pretende permitir que os Laboratórios Nacionais dos EUA, a rede de laboratórios de P&D do Departamento de Energia, utilizem seus…
Esses egressos de Yale e Berkeley acabaram de levantar 2 milhões de dólares para construir um assistente de IA que pode rivalizar com a OpenAI
[the_ad id="145565"] Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura líder da indústria em IA. Saiba mais…