Bolt42

Inscreva-se em nossos boletins diários e semanais para obter as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de ponta. Saiba mais


Diffbot, uma pequena empresa do Vale do Silício, mais conhecida por manter um dos maiores índices de conhecimento da web do mundo, anunciou hoje o lançamento de um novo modelo de IA que promete enfrentar um dos maiores desafios do setor: a precisão factual.

O novo modelo, uma versão ajustada do LLama 3.3 da Meta, é a primeira implementação de código aberto de um sistema conhecido como Geração Aumentada por Recuperação de Grafos, ou GraphRAG.

Diferente dos modelos de IA convencionais, que dependem exclusivamente de grandes quantidades de dados de treinamento pré-carregados, a LLM da Diffbot usa informações em tempo real do Knowledge Graph da empresa, um banco de dados constantemente atualizado que contém mais de um trilhão de fatos interconectados.

“Temos a tese de que, eventualmente, o raciocínio de propósito geral será destilado em cerca de 1 bilhão de parâmetros,” disse Mike Tung, fundador e CEO da Diffbot, em uma entrevista ao VentureBeat. “Você não quer, de fato, o conhecimento no modelo. Você quer que o modelo seja bom em usar ferramentas para poder consultar o conhecimento externamente.”

Como funciona

O Knowledge Graph da Diffbot é um banco de dados automatizado e expansivo que vem vasculhando a web pública desde 2016. Ele categoriza as páginas da web em entidades como pessoas, empresas, produtos e artigos, extraindo informações estruturadas usando uma combinação de visão computacional e processamento de linguagem natural.

A cada quatro a cinco dias, o Knowledge Graph é atualizado com milhões de novos fatos, garantindo que se mantenha atualizado. O modelo de IA da Diffbot aproveita esse recurso consultando o grafo em tempo real para recuperar informações, em vez de depender de conhecimento estático codificado em seus dados de treinamento.

Por exemplo, ao ser questionado sobre um evento de notícias recente, o modelo pode pesquisar na web por atualizações mais recentes, extrair fatos relevantes e citar as fontes originais. Este processo é projetado para tornar o sistema mais preciso e transparente do que os LLM tradicionais.

“Imagine perguntar a uma IA sobre o clima,” disse Tung. “Em vez de gerar uma resposta baseada em dados de treinamento desatualizados, nosso modelo consulta um serviço de meteorologia ao vivo e fornece uma resposta fundamentada em informações em tempo real.”

Como o Knowledge Graph da Diffbot supera a IA tradicional na busca por fatos

Em testes de referência, a abordagem da Diffbot parece estar dando frutos. A empresa relata que seu modelo alcançou uma pontuação de precisão de 81% no FreshQA, um benchmark criado pelo Google para testar conhecimentos factuais em tempo real, superando tanto o ChatGPT quanto o Gemini. Ele também obteve 70,36% no MMLU-Pro, uma versão mais difícil de um teste padrão de conhecimento acadêmico.

Talvez o mais significativo seja que a Diffbot está tornando seu modelo totalmente de código aberto, permitindo que empresas o executem em seu próprio hardware e o personalizem para suas necessidades. Isso aborda as crescentes preocupações sobre privacidade de dados e dependência de fornecedores com grandes provedores de IA.

“Você pode executá-lo localmente na sua máquina,” observou Tung. “Não há como executar o Google Gemini sem enviar seus dados para o Google e transferi-los para fora das suas instalações.”

A IA de código aberto pode transformar a forma como as empresas lidam com dados sensíveis

O lançamento ocorre em um momento crucial no desenvolvimento da IA. Nos últimos meses, tem havido uma crescente crítica sobre a tendência dos grandes modelos de linguagem de “alucinar” ou gerar informações falsas, enquanto as empresas continuam a aumentar o tamanho dos modelos. A abordagem da Diffbot sugere um caminho alternativo — um focado em fundamentar sistemas de IA em fatos verificáveis, em vez de tentar codificar todo o conhecimento humano em redes neurais.

“Nem todos estão atrás de modelos cada vez maiores,” disse Tung. “Você pode ter um modelo que possui mais capacidade do que um grande modelo com uma abordagem não intuitiva como a nossa.”

Especialistas da indústria destacam que a abordagem baseada em grafos de conhecimento da Diffbot pode ser particularmente valiosa para aplicações empresariais onde precisão e auditabilidade são cruciais. A empresa já fornece serviços de dados para grandes empresas, incluindo Cisco, DuckDuckGo e Snapchat.

O modelo está disponível imediatamente através de um lançamento de código aberto no GitHub e pode ser testado em uma demonstração pública em diffy.chat. Para organizações que desejam implantá-lo internamente, a Diffbot afirma que a versão menor de 8 bilhões de parâmetros pode ser executada em uma única GPU Nvidia A100, enquanto a versão completa de 70 bilhões de parâmetros requer duas GPUs H100.

Olhando para o futuro, Tung acredita que o futuro da IA não está em modelos cada vez maiores, mas em melhores maneiras de organizar e acessar o conhecimento humano: “Os fatos ficam obsoletos. Muitos desses fatos serão transferidos para lugares explícitos onde você pode realmente modificar o conhecimento e onde pode ter a procedência dos dados.”

À medida que a indústria de IA enfrenta desafios em torno da precisão factual e da transparência, o lançamento da Diffbot oferece uma alternativa convincente ao paradigma dominante de que “maior é melhor”. Se conseguir mudar a direção do campo, isso ainda está por ser visto, mas certamente demonstrou que, quando se trata de IA, tamanho não é tudo.





    onze + 5 =




    Bolt42