Bolt42

Inscreva-se em nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura líder da indústria em IA. Saiba Mais


Microsoft está trazendo ainda mais opções de banco de dados para o Microsoft Fabric, ao lado de uma série de iniciativas que visam ajudar a enfrentar a complexidade dos dados empresariais.

Durante gerações, o cálculo e o armazenamento sempre estiveram intimamente ligados. Isso causou uma série de problemas de escalabilidade e silos de dados para as empresas. Em 2023, o Microsoft Fabric foi introduzido pela primeira vez como uma estratégia para ajudar a superar esse desafio. A ideia básica por trás do Microsoft Fabric é ser uma camada de dados comum entre as ferramentas de dados e análises da Microsoft. Em novembro de 2024, o Microsoft Fabric se expandiu com suporte para a plataforma de banco de dados transacional Azure SQL.

A Microsoft, assim como seus concorrentes no Google e na Amazon, possui várias plataformas de banco de dados diferentes. Embora o Azure SQL seja amplamente utilizado, quando se trata de IA, existe outra plataforma de banco de dados mais influente: o CosmosDB. Na conferência Build 2025, a Microsoft anunciou que o CosmosDB finalmente está chegando ao Microsoft Fabric. O CosmosDB é um dos bancos de dados mais críticos utilizados hoje em dia para IA, pois é a base para o serviço ChatGPT da OpenAI. O CosmosDB também está recebendo um impulso por meio da integração com o Azure AI Foundry, oferecendo acesso mais direto para IA agente a dados.

Há também uma série de atualizações de dados adicionais, incluindo suporte ao Microsoft Copilot na plataforma de inteligência de negócios PowerBI. O banco de dados SQL Server 2025 está sendo apresentado em versão prévia e o índice vetorial DiskANN (Disk Approximate Nearest Neighbor) está se tornando de código aberto.

Essas inovações abordam diretamente a complexidade de integração que atormenta as equipes de dados empresariais ao construir aplicações de IA. Um foco principal é eliminar a fragmentação de dados que prejudica as iniciativas de IA nas empresas.

“Quando converso com os clientes, a mensagem que consistentemente recebo é: unifiquem, sou o Diretor de Informação, não quero ser o Diretor de Integração ajudando a traduzir a IA em minha vantagem competitiva”, disse Arun Ulag, Vice-Presidente Corporativo de Azure Data na Microsoft, ao VentureBeat.

O Fabric acelera a IA empresarial eliminando silos de dados

O Microsoft Fabric, a plataforma de dados unificada da empresa, continua sua trajetória de crescimento rápido reunindo produtos anteriormente separados em um ecossistema coeso.

“Estamos juntando todos os nossos produtos e unificando-os em um único produto, que é o Microsoft Fabric”, disse Ulag. “De certa forma, pode-se pensar no Fabric como quase o que fizemos com o Office há 30 anos.”

Essa estratégia claramente ressoou com as empresas. Ulag afirmou que o Microsoft Fabric agora possui mais de 21.000 organizações como clientes pagantes em todo o mundo, incluindo 70% da Fortune 500.

“Está crescendo muito, muito rapidamente,” disse ele.

O CosmosDB no Fabric elimina a sobrecarga de infraestrutura NoSQL

A principal adição ao Fabric é o CosmosDB, o banco de dados de documentos NoSQL da Microsoft que alimenta muitas aplicações de IA de alto perfil.

“O CosmosDB é, de longe, frequentemente se tornando o banco de dados de escolha para as cargas de trabalho de IA do mundo,” disse Ulag. “O ChatGPT em si é construído sobre o CosmosDB… A loja de comércio eletrônico do Walmart também funciona no CosmosDB.”

Ao trazer o CosmosDB para o Fabric, a Microsoft permite que as organizações implementem bancos de dados NoSQL sem gerenciar uma infraestrutura complexa. Um dos desafios de ter uma abordagem de cálculo e armazenamento disgregados é manter o desempenho sem latência.

A Microsoft tomou medidas técnicas específicas para manter o desempenho por meio de um sistema de cache inovador.

“Dentro do Fabric, mantemos um cache altamente performático, que lida com todas as atualizações rápidas que o CosmosDB faz,” explicou Ulag. “Temos um mecanismo de sincronização muito rápido que é completamente transparente para o cliente, onde os dados são replicados em tempo quase real no OneLake.”

Essa abordagem fornece tempos de resposta em milissegundos necessários para aplicações de IA, ao mesmo tempo que elimina tarefas de gerenciamento de infraestrutura.

Por que formatos de dados de código aberto são fundamentais para o sucesso do Fabric

Enquanto a Microsoft conecta todos os seus produtos de dados pela estratégia Fabric, a tecnologia OneLake realmente armazena os dados.

Há uma complexidade tremenda em ter um lago de dados unificado que lida com vários tipos e formatos de dados diferentes, desde SQL, NoSQL até dados não estruturados. É um desafio que a Microsoft está resolvendo com uma abordagem open source.

“A Microsoft abraçou completamente formatos de dados de código aberto, então tudo no Fabric, independentemente do workload, por padrão, está sempre em Apache Parquet e Delta Lake,” disse Ulag. “É realmente um produto unificado, com arquitetura unificada e um modelo de negócios unificado, com todos os dados armazenados em um lago de dados SaaS global, que é o OneLake em formatos de dados de código aberto.”

Essa otimização significa que todos os serviços do Fabric, desde SQL até Power BI e CosmosDB, podem acessar os mesmos dados subjacentes sem conversão ou duplicação, eliminando a penalidade de desempenho tradicional associada a formatos abertos.

O lançamento de código aberto do DiskANN traz busca vetorial de nível empresarial para todos

A Microsoft não está apenas usando código aberto para formatos de dados, mas também está contribuindo com seu próprio código.

No Build, a Microsoft anunciou que está tornando a tecnologia de busca vetorial DiskANN de código aberto. A decisão da Microsoft de abrir o código do DiskANN representa uma contribuição significativa para o ecossistema de IA, tornando as capacidades de busca vetorial de nível empresarial disponíveis para todos os desenvolvedores.

“Temos uma capacidade vetorial muito, muito forte chamada DiskANN, que foi originalmente criada na Pesquisa da Microsoft e está sendo usada no Bing… embutida no CosmosDB e no Fabric,” disse Ulag.

DiskANN implementa algoritmos de busca de vizinhos aproximados (ANN) otimizados para operações baseadas em disco, tornando-o ideal para bancos de dados vetoriais em larga escala que excedem as limitações de memória. Ao tornar o DiskANN de código aberto, a Microsoft permite que os desenvolvedores implementem a mesma busca vetorial de alto desempenho usada pelo ChatGPT e outras aplicações de IA líderes. Isso ajuda a abordar um dos principais desafios na construção de sistemas de geração aumentada por recuperação (RAG), onde encontrar conteúdo semanticamente semelhante rapidamente é essencial para fundamentar as respostas da IA em dados empresariais.

“Estamos permitindo que todos obtenham os benefícios do armazenamento vetorial que estamos usando internamente,” disse Ulag.

Por que é importante para os líderes de dados empresariais

Para as empresas que lideram na adoção de IA, esses anúncios possibilitam aplicações mais sofisticadas que integram perfeitamente vários tipos de dados.

A complexidade e os desafios de lidar com os silos de dados não se referem apenas a diferentes locais, mas também a diferentes formatos. A contínua evolução do Microsoft Fabric aborda essa preocupação de uma maneira que nenhum outro fornecedor de nuvem está fazendo atualmente.

O foco e o compromisso com padrões de código aberto no núcleo também são importantes para as empresas, pois elimina alguns riscos de lock-in que estariam presentes se os dados estivessem presos em formatos proprietários.

À medida que as organizações competem cada vez mais com base nas capacidades de IA, a abordagem unificada da Microsoft remove uma barreira significativa à inovação. Organizações que adotam essa integração podem concentrar seu foco na criação de aplicações de IA que entreguem valor empresarial tangível, potencialmente superando concorrentes que ainda lutam com arquiteturas fragmentadas.





    19 − oito =




    Bolt42