Bolt42

Inscreva-se em nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder no setor. Saiba Mais


Na primeira geração da web, no final dos anos 90, a busca era aceitável, mas não ótima, e não era fácil encontrar coisas. Isso levou ao surgimento de protocolos de sindicância no início dos anos 2000, com Atom e RSS (Really Simple Syndication) proporcionando uma maneira simplificada para os proprietários de sites disponibilizarem títulos e outros conteúdos de forma fácil e pesquisável.

Na era moderna da IA, um novo grupo de protocolos está emergindo para servir ao mesmo propósito básico. Desta vez, em vez de facilitar o acesso das pessoas aos sites, o foco é tornar os sites mais acessíveis para a IA. O Modelo de Controle de Protocolo (MCP) da Google, o Agent2Agent e os grandes modelos de linguagem/LLMs.txt estão entre os esforços já existentes.

O mais novo protocolo é o NLWeb (web em linguagem natural) da Microsoft, que foi anunciado durante a conferência Build 2025. O NLWeb também está diretamente ligado à primeira geração dos padrões de sindicância da web, pois foi concebido e criado por RV Guha, que ajudou a criar o RSS, RDF (Resource Description Framework) e schema.org.

O NLWeb permite que websites adicionem facilmente interfaces conversacionais impulsionadas por IA, transformando efetivamente qualquer site em um aplicativo de IA onde os usuários podem consultar conteúdo usando linguagem natural. O NLWeb não é necessariamente sobre competir com outros protocolos; em vez disso, ele se constrói sobre eles. O novo protocolo utiliza formatos de dados estruturados existentes, como RSS, e cada instância do NLWeb funciona como um servidor MCP.

“A ideia por trás do NLWeb é que é uma maneira para qualquer um que tenha um site ou uma API já criar facilmente seu site ou API em uma aplicação agente”, disse o CTO da Microsoft, Kevin Scott, durante seu discurso na Build 2025. “Você pode pensar nele um pouco como HTML para a web agente.”

Como o NLWeb funciona para habilitar a web para empresas de IA

O NLWeb transforma websites em experiências impulsionadas por IA por meio de um processo simples que se baseia na infraestrutura web existente, enquanto aproveita tecnologias modernas de IA.

Baseando-se em dados existentes: O sistema começa aproveitando dados estruturados que os websites já publicam, incluindo marcas, feeds RSS e outros formatos semi-estruturados comumente embutidos em páginas web. Isso significa que os editores não precisam reconstruir completamente sua infraestrutura de conteúdo.

Processamento e armazenamento de dados: O NLWeb inclui ferramentas para adicionar esses dados estruturados a bancos de dados vetoriais, permitindo busca semântica e recuperação eficientes. O sistema suporta todas as principais opções de banco de dados vetorial, permitindo que os desenvolvedores escolham a solução que melhor atende às suas necessidades técnicas e de escala.

Camada de aprimoramento da IA: As LLMs então melhoram esses dados armazenados com conhecimento e contexto externos. Por exemplo, quando um usuário pergunta sobre restaurantes, o sistema automaticamente adiciona insights geográficos, avaliações e informações relacionadas, combinando o conteúdo vetorizado com as capacidades das LLMs para fornecer respostas completas e inteligentes em vez de simples recuperação de dados.

Criação de interface universal: O resultado é uma interface de linguagem natural que atende tanto usuários humanos quanto agentes de IA. Os visitantes podem fazer perguntas em inglês simples e receber respostas conversacionais, enquanto os sistemas de IA podem acessar e consultar programaticamente as informações do site através da estrutura MCP.

Essa abordagem permite que qualquer site participe da emergente web agente sem a necessidade de reestruturações técnicas extensas. Ela torna a busca e interação impulsionadas por IA tão acessíveis quanto criar uma página web básica era nos primeiros dias da internet.

O surgimento da paisagem de protocolos de IA traz muitas opções para as empresas

Estão surgindo muitos protocolos diferentes na área de IA; nem todos fazem a mesma coisa.

O Agent2Agent do Google, por exemplo, é todo sobre permitir que agentes se comuniquem entre si. Trata-se de orquestrar e comunicar IA agente e não está particularmente focado em habilitar sites existentes para IA ou conteúdo de IA. Maria Gorskikh, fundadora e CEO da AIA e colaboradora da equipe do Project NANDA do MIT, explicou ao VentureBeat que A2A do Google permite a passagem de tarefas estruturadas entre agentes usando esquemas definidos e modelos de ciclo de vida.

“Embora o protocolo seja open-source e agnóstico em relação a modelos por design, suas implementações e ferramentas atuais estão intimamente ligadas à pilha Gemini do Google – tornando-o mais uma estrutura de orquestração de backend do que uma interface de propósito geral para serviços baseados na web,” ela comentou.

Outro esforço emergente é o LLMs.txt. O objetivo é ajudar LLMs a acessar melhor o conteúdo da web. Embora à primeira vista possa parecer algo como o NLWeb, não é a mesma coisa.

“O NLWeb não compete com o LLMs.txt; é mais comparável às ferramentas de scraping da web que tentam deduzir a intenção de um site,” disse Michael Ni, VP e Analista Principal da Constellation Research, ao VentureBeat.

Krish Arvapally, cofundador e CTO da Dappier, explicou ao VentureBeat que o LLMs.txt fornece um formato estilo markdown com permissões de treinamento que ajudam os crawlers de LLM a ingerir conteúdo de forma apropriada. O NLWeb se concentra em habilitar interações em tempo real diretamente no site de um editor. O Dappier possui sua própria plataforma que automaticamente ingere feeds RSS e outros dados estruturados, então fornece interfaces conversacionais embutíveis e com marca. Os editores podem sindicá-los para seu mercado de dados.

O MCP é o outro grande protocolo e está se tornando cada vez mais um padrão de fato e um elemento fundamental do NLWeb. Fundamentalky, MCP é um padrão aberto para conectar sistemas de IA com fontes de dados. Ni explicou que na visão da Microsoft, MCP é a camada de transporte, onde, juntos, MCP e NLWeb fornecem o HTML e TCP/IP da web agente aberta.

O analista sênior da Forrester, Will McKeon-White, vê várias vantagens para o NLWeb em relação a outras opções.

“A principal vantagem do NLWeb é o melhor controle sobre como os sistemas de IA ‘veem’ as partes que compõem os websites, permitindo melhor navegação e uma compreensão mais completa das ferramentas,” McKeon-White disse ao VentureBeat. “Isso pode reduzir tanto erros de sistemas que interpretam mal o que estão vendo em sites, quanto reduzir a necessidade de reconfigurar interfaces.”

Os primeiros adotantes já veem a promessa do NLWeb para IA agente empresarial

A Microsoft não apenas lançou o NLWeb sem se preocupar se alguém o usaria.

A Microsoft já tem várias organizações envolvidas e utilizando o NLWeb, incluindo Chicago Public Media, Allrecipes, Eventbrite, Hearst (Delish), O’Reilly Media, Tripadvisor e Shopify.

Andrew Odewahn, CTO da O’Reilly Media, está entre os primeiros adotantes e vê um verdadeiro potencial no NLWeb.

“O NLWeb aproveita as melhores práticas e padrões desenvolvidos na última década na web aberta e os disponibiliza para as LLMs,” Odewahn disse ao VentureBeat. “As empresas há muito tempo otimizaram esse tipo de metadado para SEO e outros propósitos de marketing, mas agora podem aproveitar essa riqueza de dados para tornar suas próprias IAs internas mais inteligentes e capazes com o NLWeb.”

Na visão dele, o NLWeb é valioso para empresas tanto como consumidoras de informações públicas quanto como editoras de informações privadas. Ele observou que quase toda empresa tem esforços de vendas e marketing onde pode ser necessário perguntar: “O que essa empresa faz?” ou “Sobre o que é esse produto?”

“O NLWeb oferece uma ótima maneira de abrir essas informações para suas LLMs internas, para que você não precise ficar procurando para encontrá-las,” Odewahn disse. “Como editor, você pode adicionar sua própria metadados utilizando o padrão schema.org e usar o NLWeb internamente como um servidor MCP para torná-lo disponível para uso interno.”

Utilizar o NLWeb não é necessariamente um grande desafio, também. Odewahn notou que muitas organizações provavelmente já estão usando muitos dos padrões dos quais o NLWeb depende.

“Não há desvantagem em experimentá-lo agora, pois o NLWeb pode operar totalmente dentro de sua infraestrutura,” ele disse. “É um software open-source atendendo ao melhor em dados open-source, então você não tem nada a perder e muito a ganhar ao experimentá-lo agora.”

As empresas devem adotar o NLWeb agora, ou esperar?

O analista da Constellation Research, Michael Ni, tem uma visão um tanto positiva sobre o NLWeb. No entanto, isso não significa que as empresas precisem adotá-lo imediatamente.

Ni observou que o NLWeb está nos estágios iniciais de maturidade e as empresas devem esperar 2-3 anos para qualquer adoção substancial. Ele sugere que empresas inovadoras com necessidades específicas, como mercados ativos, podem considerar fazer um piloto com a capacidade de se engajar e ajudar a moldar o padrão.

“É uma especificação visionária com grande potencial, mas precisa de validação de ecossistema, ferramentas de implementação e integrações de referência antes de conseguir alcançar pilotos empresariais em massa,” Ni disse.

Outros têm uma visão um tanto mais agressiva sobre a adoção. Gorskikh sugere uma abordagem acelerada para garantir que sua empresa não fique para trás.

“Se você é uma empresa com uma grande superfície de conteúdo, base de conhecimento interna ou dados estruturados, pilotar o NLWeb agora é um passo inteligente e necessário para se manter à frente,” ela disse. “Este não é um momento de esperar para ver – é mais como a adoção inicial de APIs ou aplicativos móveis.”

Dito isso, ela observou que indústrias regulamentadas precisam ter cautela. Setores como seguros, bancos e saúde devem esperar pelo uso em produção até que haja um sistema de verificação e descoberta neutro e descentralizado em vigor. Já existem esforços iniciais abordando isso – como o projeto NANDA do MIT, do qual Gorskikh participa, que está construindo um registro aberto e descentralizado e um sistema de reputação para serviços agentes.

O que tudo isso significa para os líderes de IA empresarial?

Para os líderes de IA empresarial, o NLWeb é um momento decisivo e uma tecnologia que não deve ser ignorada.

A IA vai interagir com seu site, e você precisa habilitá-la para isso. O NLWeb é uma forma que será particularmente atraente para editores, assim como o RSS se tornou indispensável para todos os sites no início dos anos 2000. Em poucos anos, os usuários esperarão que isso esteja lá; eles esperarão poder pesquisar e encontrar coisas, enquanto sistemas de IA agentes precisarão poder acessar o conteúdo também.

Essa é a promessa do NLWeb.





    6 + 19 =




    Bolt42