As famílias de modelos Nemotron da Nvidia irão avançar os agentes de IA.

Participe de nossas newsletters diárias e semanais para receber as últimas atualizações e conteúdo exclusivo sobre cobertura de IA líder na indústria. Saiba mais

Como parte de seus vários anúncios de IA na CES 2025 hoje, a Nvidia anunciou as famílias de modelos Nemotron para avançar na IA agente.

Disponíveis como microserviços Nvidia NIM, os modelos de linguagem Llama Nemotron e os modelos de linguagem de visão Cosmos Nemotron podem potencializar agentes de IA em qualquer sistema acelerado.

A Nvidia fez o anúncio como parte da apresentação de abertura do CEO Jensen Huang hoje na CES 2025.

IA Agente

A inteligência artificial está entrando em uma nova era – a era da IA agente – onde equipes de agentes especializados podem ajudar pessoas a resolver problemas complexos e automatizar tarefas repetitivas.

Com agentes de IA personalizados, empresas de diversas indústrias podem fabricar inteligência e alcançar um nível de produtividade sem precedentes. Estes agentes de IA avançados exigem um sistema de múltiplos modelos de IA generativa otimizados para funções e capacidades de IA agente. Essa complexidade significa que a necessidade de modelos de alta qualidade e eficiência nunca foi tão grande.

“Os agentes de IA são a próxima indústria robótica e provavelmente uma oportunidade de bilhões de dólares”, disse Huang.

A família de modelos de linguagem grandes e abertos Llama Nemotron tem como objetivo fornecer uma base para a IA agente empresarial. Construídos com Llama, os modelos podem ajudar desenvolvedores a criar e implantar agentes de IA em uma variedade de aplicações, incluindo suporte ao cliente, detecção de fraudes e otimização da cadeia de suprimentos e gerenciamento de inventário de produtos.

Para ser eficaz, muitos agentes de IA precisam tanto de habilidades linguísticas quanto da capacidade de perceber o mundo e responder com a ação apropriada.

Palavras e Visuais

Com os novos modelos de linguagem de visão Cosmos Nemotron da Nvidia e os microserviços Nvidia NIM para busca e sumarização de vídeo, desenvolvedores podem criar agentes que analisam e respondem a imagens e vídeos de máquinas autônomas, hospitais, lojas e armazéns, bem como eventos esportivos, filmes e notícias. Para desenvolvedores que buscam gerar vídeos com consciência física para robótica e veículos autônomos, a Nvidia anunciou separadamente os modelos de fundação mundial Nvidia Cosmos.

Os modelos Nemotron otimizam a eficiência e a precisão computacional para agentes de IA construídos com os modelos de fundação Llama – uma das coleções de modelos de código aberto comercialmente viáveis mais populares, baixada mais de 650 milhões de vezes – e fornecem blocos de construção otimizados para o desenvolvimento de agentes de IA.

Os modelos são podados e treinados com as técnicas mais recentes da Nvidia e conjuntos de dados de alta qualidade para capacidades de agente aprimoradas. Eles se destacam em seguimento de instruções, bate-papo, chamada de funções, programação e matemática, enquanto são otimizados em tamanho para rodar em uma ampla gama de recursos de computação acelerada da Nvidia.

“A IA agente é a próxima fronteira do desenvolvimento de IA, e realizar essa oportunidade exige otimização de pilha completa em um sistema de LLMs para fornecer agentes de IA eficientes e precisos,” disse Ahmad Al-Dahle, vice-presidente e chefe de GenAI na Meta, em uma declaração. “Por meio de nossa colaboração com a Nvidia e nosso compromisso compartilhado com modelos abertos, a família Nvidia Llama Nemotron construída sobre o Llama pode ajudar empresas a criar rapidamente seus próprios agentes de IA personalizados.”

Primeiros adotantes

Principais provedores de plataformas de agentes de IA, incluindo SAP e ServiceNow, devem ser alguns dos primeiros a usar os novos modelos Llama Nemotron.

“Agentes de IA que colaboram para resolver tarefas complexas em várias linhas de negócios desbloquearão um novo nível de produtividade empresarial além dos cenários de IA generativa de hoje,” disse Philipp Herzig, diretor de IA da SAP, em uma declaração. “Por meio do Joule da SAP, centenas de milhões de usuários empresariais interagirão com esses agentes para alcançar seus objetivos mais rapidamente do que nunca. A nova família de modelos abertos Llama Nemotron da Nvidia promoverá o desenvolvimento de vários agentes de IA especializados para transformar processos de negócios.”

“Agentes de IA tornam possível que organizações realizem mais com menos esforço, estabelecendo novos padrões para a transformação empresarial,” disse Jeremy Barnes, vice-presidente de IA de plataforma da ServiceNow, em uma declaração. “O desempenho e a precisão aprimorados dos novos modelos abertos Llama Nemotron da Nvidia podem ajudar a construir serviços avançados de agentes de IA que resolvem problemas complexos em qualquer função, em qualquer setor.”

Os modelos Nvidia Llama Nemotron usam a ferramenta Nvidia NeMo para destilação, poda e alinhamento. Usando essas técnicas, os modelos são pequenos o suficiente para rodar em uma variedade de plataformas de computação enquanto oferecem alta precisão e aumento na capacidade dos modelos.

Os modelos Nemotron estarão disponíveis como modelos para download e como microserviços Nvidia NIM que podem ser facilmente implantados em nuvens, data centers, PCs e estações de trabalho. Eles têm a intenção de oferecer desempenho líder da indústria para as empresas com integração confiável, segura e perfeita em seus fluxos de trabalho de aplicações de IA agente.

Personalize e conecte-se ao conhecimento empresarial com Nvidia NeMo

As famílias de modelos Llama Nemotron e Cosmos Nemotron estão disponíveis nos tamanhos Nano, Super e Ultra para fornecer opções de implantação de agentes de IA em todas as escalas.

● Nano: O modelo mais econômico otimizado para aplicações em tempo real com baixa latência, ideal para implantação em PCs e dispositivos de borda.

● Super: Um modelo de alta precisão que oferece excepcional capacidade de processamento em uma única GPU.

● Ultra: O modelo de mais alta precisão, projetado para aplicações em escala de data center que exigem o mais alto desempenho.

As empresas também podem personalizar os modelos para seus casos de uso e domínios específicos com microserviços Nvidia NeMo para simplificar a curadoria de dados, acelerar a personalização e avaliação de modelos e aplicar barreiras para manter as respostas no caminho certo.

Com o Nvidia NeMo Retriever, os desenvolvedores também podem integrar capacidades de geração aumentada por recuperação (RAG) para conectar modelos aos dados empresariais.

Usando os Nvidia Blueprints para IA agente, as empresas podem criar suas próprias aplicações usando as ferramentas avançadas de IA da Nvidia e a experiência de desenvolvimento de ponta a ponta. De fato, o Nvidia Cosmos Nemotron, o Nvidia Llama Nemotron e o NeMo Retriever potencializam o novo Nvidia Blueprint para busca e sumarização de vídeo (anunciado separadamente hoje).

NeMo, NeMo Retriever e Nvidia Blueprints estão todos disponíveis com a plataforma de software Nvidia AI Enterprise.

Disponibilidade

Os modelos Llama Nemotron e Cosmos Nemotron estarão disponíveis como APIs hospedadas e para download em build.nvidia.com e no Hugging Face. O acesso para desenvolvimento, teste e pesquisa é gratuito para membros do Programa de Desenvolvedores Nvidia.

As empresas podem executar microserviços Llama Nemotron e Cosmos Nemotron NIM em produção com a plataforma de software Nvidia AI Enterprise em infraestrutura de data center e nuvem acelerada.

Insights diários sobre casos de uso empresarial com VB Daily

Se você quer impressionar seu chefe, o VB Daily tem tudo o que você precisa. Nós oferecemos uma visão interna sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para um ROI máximo.

Leia nossa Política de Privacidade

Obrigado por se inscrever. Confira mais newsletters do VB aqui.

Ocorreu um erro.