Participe das nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura líder de IA da indústria. Saiba mais
A Nvidia anunciou que seu Nvidia AI Blueprint tornará fácil para desenvolvedores de qualquer setor construir agentes de IA para analisar conteúdo de vídeo e imagem.
Com essa tecnologia, a Nvidia afirma que qualquer setor agora pode pesquisar e resumir enormes volumes de dados visuais.
A Accenture, Dell e Lenovo estão entre as empresas que estão utilizando a nova Nvidia AI Blueprint para desenvolver agentes de IA visual que podem aumentar a produtividade, otimizar processos e criar espaços mais seguros.
Empresas e organizações do setor público em todo o mundo estão desenvolvendo agentes de IA para aumentar as capacidades de suas equipes que dependem de informações visuais provenientes de um número crescente de dispositivos — incluindo câmeras, sensores IoT e veículos.
Para apoiar esse trabalho, um novo Nvidia AI Blueprint para pesquisa e resumo de vídeo permitirá que desenvolvedores de praticamente qualquer setor construam agentes de IA visual que analisam conteúdo de vídeo e imagem. Esses agentes podem responder a perguntas dos usuários, gerar resumos e permitir alertas para cenários específicos.
Parte do Nvidia Metropolis, um conjunto de ferramentas para desenvolvedores para construção de aplicações de IA visual, o blueprint é um fluxo de trabalho personalizável que combina tecnologias de visão computacional e IA generativa da Nvidia.
Integradores de sistemas globais e provedores de soluções tecnológicas, incluindo Accenture, Dell e Lenovo, estão trazendo a Nvidia AI Blueprint para pesquisa e resumo visual para empresas e cidades em todo o mundo, impulsionando a próxima onda de aplicações de IA que podem ser implantadas para aumentar a produtividade e segurança em fábricas, armazéns, lojas, aeroportos, cruzamentos de trânsito e muito mais.
Anunciado antes do Smart City Expo World Congress, o Nvidia AI Blueprint oferece aos desenvolvedores de computação visual um conjunto completo de software otimizado para construir e implantar agentes de IA baseados em geração que podem ingerir e entender enormes volumes de fluxos de vídeo ao vivo ou arquivos de dados.
Os usuários podem personalizar esses agentes de IA visual com prompt de linguagem natural em vez de código rígido de software, reduzindo a barreira para a implementação de assistentes virtuais em diversos setores e aplicações de cidades inteligentes.
Os Nvidia AI Blueprints aproveitam modelos de linguagem visual (VLMs)
Os agentes de IA visual são alimentados por modelos de linguagem visual (VLMs), uma classe de modelos de IA generativa que combinam visão computacional e compreensão de linguagem para interpretar o mundo físico e realizar tarefas de raciocínio.
O Nvidia AI Blueprint para pesquisa e resumo de vídeo pode ser configurado com microserviços Nvidia NIM para VLMs como Nvidia VILA, LLMs como Llama 3.1 405B da Meta, e modelos de IA para resposta a perguntas acelerada por GPU e geração aumentada por recuperação contextual.
Os desenvolvedores podem facilmente substituir outros VLMs, LLMs e bancos de dados gráficos e ajustá-los usando a plataforma Nvidia NeMo para seus ambientes e casos de uso exclusivos.
A adoção do Nvidia AI Blueprint pode economizar meses de esforço para os desenvolvedores na investigação e otimização de modelos de IA generativa para aplicações de cidades inteligentes.
Implantado em GPUs Nvidia na borda, nas instalações ou na nuvem, pode acelerar drasticamente o processo de vasculhar arquivos de vídeo para identificar momentos chave.
Em um ambiente de armazém, um agente de IA construído com este fluxo de trabalho poderia alertar os trabalhadores se os protocolos de segurança forem violados. Em cruzamentos movimentados, um agente de IA poderia identificar colisões de trânsito e gerar relatórios para auxiliar os esforços de resposta a emergências. E no campo da infraestrutura pública, trabalhadores de manutenção poderiam pedir aos agentes de IA para revisar filmagens aéreas e identificar estradas, trilhos de trem ou pontes degradadas para apoiar a manutenção proativa.
Além de espaços inteligentes, agentes de IA visual também poderiam ser usados para resumir vídeos para pessoas com deficiência visual, gerar automaticamente recapitulações de eventos esportivos e ajudar a etiquetar enormes conjuntos de dados visuais para treinar outros modelos de IA.
O fluxo de trabalho de pesquisa e resumo de vídeo se junta a uma coleção de Nvidia AI Blueprints que facilitam a criação de avatares digitais baseados em IA, a construção de assistentes virtuais para atendimento ao cliente personalizado e a extração de insights empresariais de dados em PDF.
Os Nvidia AI Blueprints estão disponíveis gratuitamente para desenvolvedores experimentarem e baixarem, e podem ser implantados em produção em data centers acelerados e nuvens com o Nvidia AI Enterprise, uma plataforma de software de ponta a ponta que acelera pipelines de ciência de dados e simplifica o desenvolvimento e implantação de IA generativa.
Agentes de IA para fornecer insights de armazéns a capitais mundiais.
Clientes das áreas empresariais e do setor público também podem aproveitar toda a coleção de Nvidia AI Blueprints com a ajuda do ecossistema de parceiros da Nvidia.
A Accenture, uma empresa global de serviços profissionais, integrou os Nvidia AI Blueprints em sua Accenture AI Refinery, que é baseada na Nvidia AI Foundry e permite que os clientes desenvolvam modelos de IA personalizados treinados com dados empresariais.
Integradores de sistemas globais no Sudeste Asiático — incluindo a ITMAX na Malásia e a FPT no Vietnã — estão construindo agentes de IA baseados na pesquisa e resumo de vídeo da Nvidia AI Blueprint para aplicações de cidades inteligentes e transporte inteligente.
Os desenvolvedores também podem construir e implantar Nvidia AI Blueprints nas plataformas Nvidia AI com computação, rede e software fornecidos por fabricantes de servidores globais. Os Nvidia AI Blueprints estão incorporados na Dell AI Factory com soluções Nvidia e Lenovo Hybrid AI.
Empresas como a K2K, um provedor de aplicativos para cidades inteligentes no ecossistema Nvidia Metropolis, usarão o novo Nvidia AI Blueprint para construir agentes de IA que analisam câmeras de tráfego ao vivo em tempo real. Isso permitirá que autoridades da cidade façam perguntas sobre a atividade nas ruas e recebam recomendações sobre maneiras de melhorar as operações. A empresa também está trabalhando com gerentes de trânsito da cidade de Palermo, na Itália, para implantar agentes de IA visual utilizando microserviços NIM e Nvidia AI Blueprints.
A Nvidia falará mais sobre isso no Smart Cities Expo World Congress, que ocorrerá em Barcelona até 7 de novembro.
VB Daily
Mantenha-se informado! Receba as últimas notícias diretamente na sua caixa de entrada diariamente
Ao se inscrever, você concorda com os Termos de Serviço da VentureBeat.
Obrigado pela inscrição. Confira mais newsletters da VB aqui.
Ocorreu um erro.
Conteúdo relacionado
OpenAI apagou acidentalmente evidências potenciais no processo de copyright do NY Times (atualizado)
[the_ad id="145565"] Advogados do The New York Times e do Daily News, que processam a OpenAI por supostamente coletar seus trabalhos para treinar seus modelos de IA sem…
Salesforce lança o Centro de Testes Agentforce para avaliar o desempenho dos agentes
[the_ad id="145565"] Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saiba mais…
Startup de chips de IA MatX, fundada por ex-funcionários do Google, levanta Série A com avaliação de mais de $300 milhões, dizem fontes.
[the_ad id="145565"] A MatX, uma startup que desenvolve chips para suportar modelos de linguagem grandes, levantou uma rodada de investimentos Série A de aproximadamente 80…