O novo paradigma: Estruturando a pilha de dados para agentes de IA

Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de ponta da indústria. Saiba mais

O lançamento do ChatGPT há dois anos foi, sem dúvida, um marco na pesquisa em IA. Isso deu um novo significado à IA voltada para o consumidor e incentivou as empresas a explorar como poderiam incorporar o GPT ou modelos semelhantes em seus respectivos casos de uso de negócios. Avançando para 2024: existe um ecossistema florescente de modelos de linguagem, que startups ágeis e grandes empresas estão aproveitando em conjunto com abordagens como a geração aumentada por recuperação (RAG) para copilotos internos e sistemas de busca de conhecimento.

Os casos de uso cresceram exponencialmente, assim como o investimento em iniciativas de IA generativa de nível empresarial. Afinal, espera-se que a tecnologia adicione $2,6 trilhões a $4,4 trilhões anualmente à economia global. Mas aqui está o detalhe: o que vimos até agora é apenas a primeira onda de IA generativa.

Nos últimos meses, várias startups e grandes organizações – como Salesforce e SAP – começaram a avançar para a próxima fase dos chamados “sistemas agentes”. Esses agentes fazem a transição da IA empresarial de um sistema baseado em prompts, capaz de aproveitar o conhecimento interno (via RAG) e responder a questões críticas de negócios, para uma entidade autônoma orientada a tarefas. Eles podem tomar decisões com base em uma situação ou conjunto de instruções, criar um plano de ação passo a passo e, em seguida, executar esse plano dentro de ambientes digitais em tempo real usando ferramentas online, APIs, etc.

A transição para os agentes de IA marca uma mudança significativa em relação à automação que conhecemos, podendo fornecer às empresas um exército de colegas de trabalho virtuais prontos para implantar que poderiam gerenciar tarefas – seja a reserva de um bilhete ou a transferência de dados de um banco de dados para outro – economizando uma quantidade significativa de tempo. A Gartner estima que até 2028, 33% das aplicações de software empresarial incluirão agentes de IA, aumentando de menos de 1% no presente, permitindo que 15% das decisões de trabalho do dia a dia sejam tomadas de forma autônoma.

Mas se os agentes de IA estão a caminho de ser algo tão importante? Como uma empresa pode integrá-los em sua pilha de tecnologia, sem comprometer a precisão? Ninguém quer que um sistema movido a IA falhe em entender as nuances do negócio (ou domínio específico) e acabe executando ações incorretas.

A resposta, como afirma Gerrit Kazmaier, VP e GM de análise de dados do Google Cloud, reside em uma estratégia de dados cuidadosamente elaborada.

“O pipeline de dados deve evoluir de um sistema para armazenar e processar dados para um ‘sistema para criar conhecimento e entendimento’. Isso requer uma mudança de foco de simplesmente coletar dados para curá-los, enriquecê-los e organizá-los de uma maneira que capacite LLMs a funcionarem como parceiros de negócios confiáveis e perspicazes”, disse Kazmaier ao VentureBeat.

Construindo o pipeline de dados para agentes de IA

Historicamente, as empresas confiaram fortemente em dados estruturados – organizados na forma de tabelas – para análise e tomada de decisões. Era a parte facilmente acessível de 10% dos dados que realmente tinham. Os restantes 90% eram “escuros”, armazenados em silos em formatos variados como PDFs e vídeos. No entanto, quando a IA entrou em ação, esses dados não estruturados não utilizados se tornaram instantaneamente um estoque de valor, permitindo que as organizações impulsionassem uma variedade de casos de uso, incluindo aplicações de IA generativa como chatbots e sistemas de busca.

A maioria das organizações hoje já possui pelo menos uma plataforma de dados (muitas com capacidades de banco de dados vetorial) em vigor para agregar todos os dados estruturados e não estruturados em um só lugar para alimentar aplicações posteriores. O surgimento de agentes de IA impulsionados por LLM marca a adição de mais uma aplicação nesse ecossistema.

Portanto, em essência, muitas coisas permanecem inalteradas. As equipes não precisam configurar sua pilha de dados do zero, mas adaptá-la com foco em certos elementos-chave para garantir que os agentes que desenvolvem entendam as nuances de seu setor, as relações intrincadas dentro de seus conjuntos de dados e a linguagem semântica específica de suas operações.

De acordo com Kazmaier, a forma ideal de fazer isso é entender que dados, modelos de IA e o valor que eles entregam (os agentes) fazem parte da mesma cadeia de valor e precisam ser construídos de forma holística. Isso significa optar por uma plataforma unificada que reúna todos os dados – de textos e imagens a áudios e vídeos – em um só lugar e tenha uma camada semântica, utilizando gráficos de conhecimento dinâmicos para capturar relacionamentos em evolução, para registrar as métricas/razões de negócios relevantes necessárias para construir agentes de IA que entendam o contexto específico da organização e do domínio para tomar ações.

“Um elemento crucial para construir agentes de IA verdadeiramente inteligentes é uma camada semântica robusta. É como dar a esses agentes um dicionário e um thesaurus, permitindo que eles entendam não apenas os dados em si, mas também o significado e as relações por trás deles… Trazer essa camada semântica diretamente para a nuvem de dados, como estamos fazendo com LookML e BigQuery, pode ser uma mudança de jogo,” explicou.

Embora as organizações possam optar por abordagens manuais para gerar semânticas de negócios e criar essa camada crucial de inteligência, Gerrit observa que o processo pode ser facilmente automatizado com a ajuda da IA.

“É aqui que a mágica realmente acontece. Ao combinar essas ricas semânticas com a forma como a empresa tem utilizado seus dados e outros sinais de contexto em um gráfico de conhecimento dinâmico, podemos criar uma rede inteligente adaptativa e ágil. É como uma base de conhecimento viva que evolui em tempo real, alimentando novas aplicações impulsionadas por IA e desbloqueando níveis sem precedentes de insight e automação,” explicou.

No entanto, treinar LLMs que alimentam agentes na camada semântica (aprendizado contextual) é apenas uma parte do quebra-cabeça. O agente de IA também deve entender como as coisas realmente funcionam no ambiente digital em questão, cobrindo aspectos que nem sempre estão documentados ou capturados em dados. É aqui que entram a construções de observabilidade e fortes ciclos de reforço, de acordo com Gevorg Karapetyan, CTO e cofundador da startup de agentes de IA Hercules AI.

Falando com o VentureBeat no WCIT 2024, Karapetyan disse que estão adotando exatamente essa abordagem para quebrar a última milha com agentes de IA para seus clientes.

“Primeiro fazemos o ajuste fino contextual, com base em dados de clientes personalizados e dados sintéticos, de modo que o agente possa ter a base de conhecimento geral e de domínio. Então, com base em como ele começa a trabalhar e interagir com seu respectivo ambiente (dados históricos), melhoramos ainda mais. Dessa forma, eles aprendem a lidar com condições dinâmicas em vez de um mundo perfeito,” explicou.

Qualidade de dados, governança e segurança permanecem tão importantes

Com a camada semântica e o loop de reforço baseado em dados históricos no lugar, as organizações podem alimentar sistemas de IA agentes robustos. No entanto, é importante notar que construir uma pilha de dados dessa maneira não significa desmerecer as melhores práticas habituais.

Isso essencialmente significa que a plataforma utilizada deve captar e processar dados em tempo real de todas as principais fontes (capacitando os agentes a se adaptar, aprender e agir instantaneamente de acordo com a situação), ter sistemas para garantir a qualidade/riqueza dos dados e, então, ter políticas de acesso, governança e segurança robustas para garantir o uso responsável dos agentes.

“Governança, controle de acesso e qualidade dos dados tornam-se na verdade mais importantes na era dos agentes de IA. As ferramentas para determinar quais serviços têm acesso a quais dados tornam-se o método para garantir que os sistemas de IA se comportem de acordo com as regras de privacidade de dados. A qualidade dos dados, por sua vez, determina o quão bem (ou mal) um agente pode executar uma tarefa,” disse Naveen Rao, VP de IA na Databricks, ao VentureBeat.

Ele disse que deixar de lado essas frentes de qualquer forma poderia ser “desastroso” tanto para a reputação da empresa quanto para seus clientes finais.

“Nenhum agente, não importa a qualidade ou os resultados impressionantes, deve ver a luz do dia se os desenvolvedores não tiverem confiança de que apenas as pessoas certas podem acessar as informações/capacidades de IA corretas. Por isso começamos com a camada de governança com o Unity Catalog e construímos nossa pilha de IA em cima disso,” destacou Rao.

O Google Cloud, por sua vez, está usando IA para lidar com parte do trabalho manual que precisa ser feito nos pipelines de dados. Por exemplo, a empresa está usando agentes de dados inteligentes para ajudar as equipes a descobrir, limpar e preparar rapidamente seus dados para a IA, quebrando silos de dados e garantindo qualidade e consistência.

“Ao embutir IA diretamente na infraestrutura de dados, podemos capacitar as empresas a desbloquear o verdadeiro potencial da IA generativa e acelerar sua inovação em dados,” disse Kazmaier.

Dito isso, enquanto o surgimento de agentes de IA representa uma mudança transformadora em como as empresas podem aproveitar a automação e a inteligência para otimizar operações, o sucesso desses projetos dependerá diretamente de uma pilha de dados bem arquitetada. À medida que as organizações evoluem suas estratégias de dados, aquelas que priorizarem a integração contínua de uma camada semântica com um foco específico na qualidade dos dados, acessibilidade, governança e segurança estarão melhor posicionadas para desbloquear todo o potencial dos agentes de IA e liderar a próxima onda de inovação empresarial.

A longo prazo, esses esforços, combinados com os avanços nos modelos de linguagem subjacentes, devem marcar um crescimento de quase 45% para o mercado de agentes de IA, impulsionando-o de $5,1 bilhões em 2024 para $47,1 bilhões até 2030.

VB Daily

Mantenha-se informado! Receba as últimas notícias na sua caixa de entrada diariamente

Ao se inscrever, você concorda com os Termos de Serviço do VentureBeat.

Obrigado por se inscrever. Confira mais boletins do VB aqui.

Ocorreu um erro.

Conteúdo relacionado

BusinessInteligência artificial

O modelo o3 da OpenAI pode ser mais caro de operar do que originalmente estimado.

[the_ad id="145565"] Quando a OpenAI revelou seu modelo de IA “reasoning” o3 em dezembro, a empresa se uniu aos criadores do ARC-AGI, um benchmark projetado para testar IAs…

BusinessInteligência artificial

O ‘Modo Café’ da Zencoder é o futuro da programação: Aperte um botão e deixe a IA escrever seus testes unitários.

[the_ad id="145565"] Certainly! Below is the content rewritten in Portuguese while maintaining the original HTML structure and tags: <div> <div…

BusinessInteligência artificial

Uplimit eleva as apostas na aprendizagem corporativa com conjunto de agentes de IA que podem treinar 1.000 funcionários simultaneamente.

[the_ad id="145565"] Participe dos nossos boletins informativos diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de ponta. Saiba…