Inscreva-se em nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA líder do setor. Saiba mais
Uma startup baseada no Brooklyn está focando em um dos pontos mais problemáticos no mundo da inteligência artificial e análise de dados: o processo trabalhoso de preparação de dados.
Structify saiu do modo stealth hoje, anunciando seu lançamento público juntamente com um financiamento inicial de $4,1 milhões liderado pela Bain Capital Ventures, com a participação de 8VC, Integral Ventures e investidores anjos estratégicos.
A plataforma da empresa utiliza um modelo visual proprietário chamado DoRa para automatizar a coleta, limpeza e estruturação de dados — um processo que consome até 80% do tempo dos cientistas de dados, de acordo com pesquisas do setor.
“O volume de informações disponíveis hoje explodiu,” disse Ronak Gandhi, co-fundador da Structify, em uma entrevista exclusiva à VentureBeat. “Chegamos a um ponto de inflexão na disponibilidade de dados, que é tanto uma bênção quanto uma maldição. Embora tenhamos acesso sem precedentes à informação, ela permanece amplamente inacessível porque é tão difícil convertê-la no formato adequado para tomar decisões comerciais significativas.”
A abordagem da Structify reflete um foco crescente em resolver o que os especialistas em dados chamam de “o gargalo da preparação de dados.” Pesquisas da Gartner indicam que a preparação de dados inadequada continua sendo um dos principais obstáculos para a implementação bem-sucedida de IA, com quatro em cada cinco empresas sem as bases de dados necessárias para aproveitar totalmente a IA generativa.
Como a transformação de dados impulsionada por IA está desbloqueando a inteligência de negócios oculta em escala
No cerne da questão, a Structify permite que os usuários criem conjuntos de dados personalizados especificando o esquema de dados, selecionando fontes e implantando agentes de IA para extrair esses dados. A plataforma pode lidar com tudo, desde arquivos da SEC e perfis do LinkedIn até artigos de notícias e documentos especializados da indústria.
O que diferencia a Structify, segundo Gandhi, é seu modelo interno DoRa, que navega na web como um humano.
“É de qualidade super alta. Navega e interage com as coisas como uma pessoa faria,” explicou Gandhi. “Portanto, estamos falando de qualidade humana — esse é o primeiro e mais importante princípio por trás do DoRa. Ele lê a internet da maneira que um humano faria.”
Essa abordagem permite que a Structify suporte um nível gratuito, que Gandhi acredita que ajudará a democratizar o acesso a dados estruturados.
“A maneira como você pensa sobre dados agora é, eles são um objeto realmente precioso,” disse Gandhi. “Essa coisa preciosa que você passa tanto tempo tentando manipular, e quando a tem, você pensa: ‘Oh, se alguém a deletasse, eu choraria.’”
A visão da Structify é “comoditizar dados” — tornando-os algo que pode ser facilmente recriado se perdido.
Da finança à construção: Como as empresas estão utilizando conjuntos de dados personalizados para resolver desafios específicos da indústria
A empresa já viu adoção em múltiplos setores. Equipes financeiras o utilizam para extrair informações de apresentações, empresas de construção transformam documentos geotécnicos complexos em tabelas legíveis e equipes de vendas reúnem organogramas em tempo real de suas contas.
Slater Stich, parceiro na Bain Capital Ventures, destacou essa versatilidade no anúncio de financiamento: “Toda empresa com que já trabalhei tem uma quantidade de fontes de dados que são extremamente importantes e uma grande dor de trabalhar, seja com números enterrados em PDFs, espalhados por centenas de páginas da web, ou ocultos atrás de uma API SOAP empresarial, etc.”
A diversidade da base de clientes inicial da Structify reflete a natureza universal dos desafios da preparação de dados. De acordo com uma pesquisa da TechTarget, a preparação de dados geralmente envolve uma série de etapas laborais: coleta, descoberta, perfilagem, limpeza, estruturação, transformação e validação — tudo antes que qualquer análise real possa começar.
Por que a experiência humana continua crucial para a precisão da IA: Dentro do sistema de ‘verificação quádrupla’ da Structify
Um diferencial chave para a Structify é seu processo de “verificação quádrupla”, que combina IA com supervisão humana. Esta abordagem aborda uma preocupação crítica no desenvolvimento de IA: garantir a precisão.
“Sempre que um usuário vê algo que parece suspeito, ou identificamos alguns dados como potencialmente suspeitos, podemos enviá-lo a um especialista naquele caso específico,” explicou Gandhi. “Esse especialista pode agir da mesma forma que [DoRa], navegar para o pedaço de informação correto, extrair, salvar e verificar se está certo.”
Esse processo não apenas corrige os dados, mas também cria exemplos de treinamento que melhoram o desempenho do modelo ao longo do tempo, especialmente em domínios especializados, como construção ou pesquisa farmacêutica.
“Essas coisas são tão bagunçadas,” observou Gandhi. “Nunca pensei na minha vida que teria uma forte compreensão de geologia. Mas lá estamos, e isso, eu acho, é uma grande força — ser capaz de aprender com esses especialistas e colocar isso diretamente no DoRa.”
À medida que as ferramentas de extração de dados se tornam mais poderosas, as preocupações com a privacidade inevitavelmente surgem. A Structify implementou salvaguardas para abordar essas questões.
“Nós não fazemos nenhuma autenticação, nada que exija um login, nada que exija que você vá por trás de algum tipo de informação — nosso agente não faz isso porque isso é uma preocupação de privacidade,” disse Gandhi.
A empresa também prioriza a transparência, fornecendo informações diretas de origem. “Se você estiver interessado em aprender mais sobre um determinado pedaço de informação, você vai diretamente para esse conteúdo e verá, ao contrário de provedores legados onde é uma caixa preta.”
A Structify entra em um cenário competitivo que inclui tanto players estabelecidos quanto outras startups abordando vários aspectos do desafio da preparação de dados. Empresas como Alteryx, Informatica, Microsoft e Tableau oferecem capacidades de preparação de dados, enquanto vários especialistas foram adquiridos nos últimos anos.
O que diferencia a Structify, segundo o CEO Alex Reichenbach, é sua combinação de velocidade e precisão. Um post recente no LinkedIn de Reichenbach afirmou que eles aceleraram seu agente “10x enquanto cortavam custos em cerca de 16x” através da otimização do modelo e melhorias na infraestrutura.
O lançamento da empresa ocorre em meio a um crescente interesse em automação de dados impulsionada por IA. De acordo com um relatório da TechTarget, automatizar a preparação de dados “é frequentemente citado como uma das principais áreas de investimento para equipes de dados e análises,” com capacidades de preparação de dados aumentadas se tornando cada vez mais importantes.
Como experiências frustrantes de preparação de dados inspiraram dois amigos a revolucionar a indústria
Para Gandhi, a Structify aborda problemas que ele enfrentou pessoalmente em funções anteriores.
“A grande questão sobre a história de fundação da Structify é que é tanto uma questão pessoal quanto profissional,” lembrou Gandhi. “Eu estava contando a [Alex] sobre a época em que trabalhava como analista de dados e fazia operações e consultoria, preparando esses conjuntos de dados realmente exclusivos e sob medida para clientes — listas de todos os influenciadores de fitness e suas métricas de seguidores, listas de empresas e quais empregos estão postando, museus na Costa Leste… Eu estava gastando muito tempo preparando-os manualmente, fazendo scraping, entrada de dados, tudo isso.”
A incapacidade de iterar rapidamente de ideia para conjunto de dados era particularmente frustrante. “O que me incomodava era que você não podia iterar e passar da ideia para o conjunto de dados de forma rápida,” disse Gandhi.
Seu co-fundador, Alex Reichenbach, enfrentou desafios semelhantes enquanto trabalhava em um banco de investimento, onde problemas de qualidade de dados dificultavam os esforços para construir modelos em cima de conjuntos de dados estruturados.
Como a Structify planeja usar seu financiamento inicial de $4,1 milhões para transformar a preparação de dados empresariais
Com o novo financiamento, a Structify planeja expandir sua equipe técnica e se estabelecer como “a ferramenta de dados preferida em diversas indústrias.” A empresa oferece atualmente camadas gratuitas e pagas, com opções empresariais para aqueles que precisam de recursos avançados, como implantação no local ou extração de dados altamente especializada.
À medida que mais empresas investem em iniciativas de IA, a importância de dados estruturados de alta qualidade só aumentará. Um recente relatório do MIT Technology Review Insights constatou que quatro em cada cinco empresas não estão preparadas para capitalizar em IA generativa devido a bases de dados deficientes.
Para Gandhi e a equipe da Structify, resolver esse desafio fundamental pode desbloquear um valor significativo em diversas indústrias.
“O fato de você poder imaginar um mundo onde criar conjuntos de dados é iterativo é algo meio impressionante para muitos de nossos usuários,” disse Gandhi. “No final das contas, a proposta é sobre ter esse controle e customização.”
Insights diários sobre casos de uso empresarial com VB Daily
Se você quer impressionar seu chefe, o VB Daily tem o que você precisa. Nós trazemos as últimas novidades sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para um ROI máximo.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais boletins do VB aqui.
Ocorreu um erro.

Conteúdo relacionado
A Microsoft espera algumas limitações de capacidade de IA neste trimestre.
[the_ad id="145565"] Um executivo alertou durante a conferência de resultados da Microsoft na quarta-feira que os clientes podem enfrentar interrupções nos serviços de IA à…
CNTXT AI Lança Munsit: O Sistema de Reconhecimento de Fala em Árabe Mais Precisoso Já Criado
[the_ad id="145565"] Em um momento decisivo para a inteligência artificial em língua árabe, CNTXT AI lançou Munsit, um modelo de reconhecimento de fala em árabe de próxima…
Evitando o jogo de culpados em segurança com inteligência artificial
[the_ad id="145565"] Apresentado pela Elastic 95% das falhas de cibersegurança são causadas por erro humano: dores de cabeça como ameaças internas, uso indevido de credenciais…