Inscreva-se em nossos boletins diários e semanais para receber as últimas atualizações e conteúdo exclusivo sobre o setor de IA. Saiba mais
À medida que as operações de IA nas empresas crescem, ter acesso a dados não é mais suficiente. As empresas agora precisam de um acesso confiável, consistente e preciso aos dados.
Neste contexto, os fornecedores de bancos de dados SQL distribuídos desempenham um papel fundamental, fornecendo uma plataforma de banco de dados replicada que pode ser altamente resiliente e disponível. A atualização mais recente da Cockroach Labs se concentra em habilitar a pesquisa vectorial e IA autônoma em escala SQL distribuída. O CockroachDB 25.2 é lançado hoje, prometendo um ganho de eficiência de 41%, um índice vetorial otimizado para IA em escala SQL distribuída e melhorias principais no banco de dados que melhoram tanto as operações quanto a segurança.
O CockroachDB é uma das várias opções de SQL distribuído disponíveis no mercado atualmente, incluindo Yugabyte, Amazon Aurora dSQL e Google AlloyDB. Desde sua criação, há uma década, a empresa se empenha em se diferenciar dos concorrentes ao ser mais resiliente. De fato, o nome ‘cockroach’ vem da ideia de que uma barata é realmente difícil de matar. Essa ideia permanece relevante na era da IA.
“Certamente as pessoas estão interessadas em IA, mas as razões pelas quais as pessoas escolhem a Cockroach há cinco anos, dois anos ou mesmo este ano parecem ser bastante consistentes, elas precisam que este banco de dados sobreviva”, afirmou Spencer Kimball, cofundador e CEO da Cockroach Labs, ao VentureBeat. “IA em nosso contexto é IA misturada com as capacidades operacionais que a Cockroach oferece… na medida em que a IA está se tornando mais importante, é sobre como minha IA sobrevive, ela precisa ser tão crítica quanto os próprios metadados.”
O problema de indexação vetorial distribuída enfrentado pela IA empresarial
Bancos de dados capazes de vetores, que são usados por sistemas de IA tanto para treinamento quanto para cenários de Geração Aumentada por Recuperação (RAG), são comuns em 2025.
Kimball argumentou que os bancos de dados vetoriais funcionam bem em nós únicos. Eles tendem a ter dificuldades em implantações maiores com múltiplos nós geograficamente dispersos, que é o que o SQL distribuído aborda. A abordagem do CockroachDB enfrenta o complexo problema da indexação vetorial distribuída. O novo índice vetorial C-SPANN da empresa usa o algoritmo SPANN, baseado em pesquisa da Microsoft. Isso lida especificamente com bilhões de vetores em um sistema distribuído baseado em disco.
Compreender a arquitetura técnica revela por que isso representa um desafio tão complexo. A indexação vetorial no CockroachDB não é uma tabela separada; é um tipo de índice aplicado a colunas dentro de tabelas existentes. Sem um índice, as pesquisas de similaridade vetorial realizam análises lineares exaustivas em todos os dados. Isso funciona bem para conjuntos de dados pequenos, mas se torna proibitivamente lento à medida que as tabelas crescem.
A equipe de engenharia da Cockroach Labs teve que resolver múltiplos problemas simultaneamente: eficiência uniforme em escala massiva, autoequilíbrio de índices e manutenção da precisão enquanto os dados subjacentes mudam rapidamente.
Kimball explicou que o algoritmo C-SPANN resolve isso criando uma hierarquia de partições para vetores em um espaço multidimensional muito alto. Essa estrutura hierárquica permite buscas de similaridade eficientes, mesmo entre bilhões de vetores.
Melhorias de segurança abordam desafios de conformidade da IA
Aplicações de IA lidam com dados cada vez mais sensíveis. O CockroachDB 25.2 introduz recursos de segurança aprimorados, incluindo segurança a nível de linha e suítes de cifras configuráveis.
Essas capacidades atendem a requisitos regulatórios como DORA e NIS2, que muitas empresas lutam para cumprir.
A pesquisa da Cockroach Labs mostra que 79% dos líderes de tecnologia relatam estar despreparados para novas regulamentações. Enquanto isso, 93% citam preocupações sobre o impacto financeiro de falhas, que average mais de $222.000 anualmente.
“A segurança é algo que está aumentando significativamente e acho que a grande questão sobre segurança é que, como muitas coisas, ela é dramaticamente impactada por essa questão da IA,” observou Kimball.
Big data operacional para IA autônoma está prestes a impulsionar um crescimento massivo
A próxima onda de cargas de trabalho impulsionadas por IA cria o que Kimball chama de “big data operacional”—um desafio fundamentalmente diferente da tradicional análise de big data.
Enquanto o big data convencional se concentra no processamento em lote de grandes conjuntos de dados para obter insights, o big data operacional exige desempenho em tempo real em escala maciça para aplicações críticas.
“Quando você realmente pensa sobre as implicações da IA autônoma, é apenas uma atividade muito maior atingindo APIs e, em última análise, causando requisitos de transferência para os bancos de dados subjacentes,” explicou Kimball.
A distinção é extremamente importante. Sistemas de dados tradicionais podem tolerar latência e consistência eventual porque suportam cargas de trabalho analíticas. O big data operacional alimenta aplicações ao vivo onde milissegundos importam e a consistência não pode ser comprometida.
Agentes de IA impulsionam essa mudança operando em velocidade de máquina em vez de no ritmo humano. O tráfego atual dos bancos de dados provém principalmente de humanos com padrões de uso previsíveis. Kimball enfatizou que agentes de IA multiplicarão essa atividade exponencialmente.
Avanço de desempenho visa a economia das cargas de trabalho de IA
Melhores economias e eficiência são necessárias para lidar com a crescente escala de acesso a dados.
A Cockroach Labs afirma que o CockroachDB 25.2 proporciona uma melhoria de eficiência de 41%. Duas otimizações principais nesta versão ajudarão a melhorar a eficiência geral do banco de dados: planos de consultas genéricas e gravações em buffer.
As gravações em buffer resolvem um problema específico com consultas geradas por mapeamento objeto-relacional (ORM) que tendem a ser “tagarelas”. Elas lêem e escrevem dados através de nós distribuídos de forma ineficiente. O recurso de gravações em buffer mantém as gravações nos coordenadores SQL locais. Isso elimina viagens desnecessárias pela rede.
“O que as gravações em buffer fazem é manter todas as gravações que você está planejando fazer no coordenador SQL local,” explicou Kimball. “Assim, se você ler algo que acabou de escrever, não precisa voltar à rede.”
Os planos de consulta genéricos resolvem uma ineficiência fundamental em aplicações de alto volume. A maioria das aplicações empresariais usa um conjunto limitado de tipos de transações que são executadas milhões de vezes com diferentes parâmetros. Em vez de replanejar repetidamente estruturas de consulta idênticas, o CockroachDB agora armazena em cache e reutiliza esses planos.
Implementar planos de consulta genéricos em sistemas distribuídos apresenta desafios únicos que bancos de dados de nó único não enfrentam. O CockroachDB deve garantir que os planos armazenados em cache permaneçam ótimos em nós distribuídos geograficamente com latências variadas.
“Em SQL distribuído, os planos de consulta genéricos são um pouco mais pesados, porque você está falando sobre um conjunto potencialmente geo-distribuído de nós com latências diferentes,” explicou Kimball. “Você deve ter cuidado com o plano de consulta genérico para não usar algo que seja subótimo porque você confundiu como, ah bem, isso parece o mesmo.”
O que isso significa para as empresas que planejam a infraestrutura de IA e dados
Líderes de dados empresariais enfrentam decisões imediatas, conforme a IA autônoma ameaça sobrecarregar a infraestrutura de banco de dados atual.
A transição de cargas de trabalho impulsionadas por humanos para cargas de trabalho impulsionadas por IA criará desafios de big data operacional que muitas organizações não estão preparadas para enfrentar. Preparar-se agora para o inevitável crescimento do tráfego de dados da IA autônoma é uma forte prioridade. Para as empresas que lideram a adoção de IA, faz sentido investir agora em uma arquitetura de banco de dados distribuído que possa lidar com operações SQL tradicionais e vetoriais em escala.
O CockroachDB 25.2 oferece uma opção potencial, elevando o desempenho e a eficiência do SQL distribuído para atender aos desafios de dados da IA autônoma. Fundamentalmente, trata-se de ter a tecnologia em vigor para escalar tanto a recuperação de dados vetoriais quanto tradicionais.
Insights diários sobre casos de uso empresarial com VB Daily
Se você quer impressionar seu chefe, o VB Daily tem o que você precisa. Oferecemos informações privilegiadas sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para um ROI máximo.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais boletins informativos da VB aqui.
Ocorreu um erro.

Conteúdo relacionado
X altera seus termos para proibir o treinamento de modelos de IA com seu conteúdo.
[the_ad id="145565"] A rede social X alterou seu contrato com desenvolvedores para impedir que terceiros utilizem o conteúdo da plataforma para treinar modelos de linguagem de…
A América do Norte concentra a maior parte dos investimentos em capital de risco em IA, apesar do ambiente político desafiador.
[the_ad id="145565"] Apesar do que alguns especialistas têm caracterizado como um ambiente cada vez mais hostil à P&D em IA, a América do Norte continua recebendo a maior…
CEO da Alphabet, Sundar Pichai, descarta temores sobre empregos com IA e destaca planos de expansão.
[the_ad id="145565"] Em uma entrevista à Bloomberg na noite de quarta-feira, no centro de San Francisco, o CEO da Alphabet, Sundar Pichai, rejeitou as preocupações de que a IA…