Durante anos, Vyas Sekar costumava ligar para Muckai Girish, um velho amigo da faculdade, para discutir possíveis ideias de startups e obter a opinião de Girish. Normalmente, os dois falavam sobre uma ideia e encerravam a conversa por ali. Quando Sekar ligou para Girish com uma ideia envolvendo dados sintéticos no início de 2022, a conversa não terminou simplesmente quando desligaram o telefone.
Sekar e sua colega da Carnegie Mellon University, Giulia Fanti, estavam trabalhando na criação de dados sintéticos para resolver a crise de reprodutibilidade, ou a incapacidade de reproduzir dados, dentro da academia. Enquanto Sekar percebia a necessidade de uma solução no meio acadêmico, Girish sabia que seus clientes estavam enfrentando o mesmo problema na época. Após conversar com algumas empresas, a tese foi ainda mais validada.
“Naquele momento, parecia que isso era muito real e havia uma oportunidade”, disse Girish, CEO, ao TechCrunch. “Isso foi o que nos motivou e, nos meses seguintes, conversamos com alguns investidores, pessoas que conhecíamos e, mais importante, empresas, e percebemos que isso era um problema significativo e que valia a pena dedicar uma vida inteira a isso.”
O resultado foi a Rockfish, uma startup que utiliza IA generativa para criar dados sintéticos para fluxos de trabalho operacionais, ajudando as empresas a superar seus silos de dados. A Rockfish se integra a provedores de banco de dados, incluindo AWS e Azure, entre outros, e auxilia os usuários a escolher a melhor configuração para seus dados com base nas políticas da empresa ou usos para os dados.
Dados sintéticos se tornaram um tópico cada vez mais discutido no mundo da IA, mas já havia uma crescente dinâmica a respeito quando a empresa foi fundada em junho de 2022. Girish afirmou que a Rockfish queria garantir que estava construindo um produto que se diferenciasse de seus pares e também uma solução que as empresas usassem diariamente, e não apenas ocasionalmente.
É por isso que o produto da empresa é projetado para processar dados continuamente e está focado em dados operacionais, que incluem informações sobre transações financeiras, cibersegurança e cadeias de suprimentos. Essas áreas estão constantemente gerando dados para as empresas e também estão em constante mudança. Girish acredita que se concentrar aqui ajuda a Rockfish a se destacar em relação aos concorrentes.
Atualmente, a empresa trabalha com alguns clientes corporativos, disse Girish, incluindo a plataforma de análise de streaming Conviva, além de departamentos governamentais como o Exército dos EUA e o Departamento de Defesa dos EUA.
A Rockfish está anunciando uma rodada de investimento semente de $4 milhões liderada pela Emergent Ventures, com a participação da Foster Ventures, TEN13 e Dallas VC, entre outros. Isso eleva o total de financiamento da empresa para cerca de $6 milhões.
Anupam Rastogi, sócio-gerente da Emergent Ventures, disse ao TechCrunch que já acompanhava Sekar muito antes da fundação da Rockfish. Ele explicou que o que levou a firma a investir foi “equipe, mercado e produto, nessa ordem.” Além disso, o foco da Rockfish em construir para empresas a tornou uma opção mais adequada para a Emergent do que alguns dos outros competidores no espaço.
“A equipe é composta por cientistas de dados de alta qualidade, com vários doutorados,” afirmou Rastogi. “Este é um espaço que consideramos muito tecnicamente sofisticado e ter essa força técnica ao redor da mesa é realmente crítico. Eles fizeram muito do trabalho fundamental nesse setor, não apenas na empresa, mas em toda a indústria.”
Embora a Rockfish espere que seu foco ajude a criar uma barreira contra concorrentes, isso não muda o fato de que os dados sintéticos provavelmente se tornarão um mercado cada vez mais saturado. Empresas de IA estão se voltando para dados sintéticos à medida que vários players acreditam que o mercado esgotou outros dados de treinamento de IA.
Já existem inúmeras startups tentando abordar o mercado, incluindo a Tonic AI, que levantou mais de $45 milhões em financiamento de risco; Mostly AI, que levantou $31 milhões em financiamento de capital de risco; e Hazy, que levantou $14,5 milhões antes de ser adquirida pela SAS em 2024, para citar algumas.
Girish afirmou que a empresa busca ampliar sua abordagem a dados sintéticos incorporando outros tipos de modelos, como modelos de espaço de estados, modelos matemáticos que utilizam variáveis de estado. A empresa também procura melhorar seus recursos de ponta a ponta.
“Não é como se você pegasse dados aleatórios da internet e gerasse dados sintéticos”, disse Girish. “Não há garantia de que funcionará bem. Mas se você juntar tudo isso para as empresas, na verdade é muito relevante e realista. Então, essa é a chave, e a capacidade de fazer isso de forma contínua é o que consideramos útil.”
A TechCrunch tem um boletim informativo focado em IA! Inscreva-se aqui para recebê-lo na sua caixa de entrada toda quarta-feira.
Conteúdo relacionado
O Novo AI ‘Co-Cientista’ do Google Tem Como Objetivo Acelerar a Descoberta Científica
[the_ad id="145565"] Imagine um parceiro de pesquisa que leu todos os artigos científicos que você, incansavelmente inovando novos experimentos a toda hora. O Google está…
Supergiant Games enfrenta acusações de contornar a greve da SAG-AFTRA
[the_ad id="145565"] Participe dos nossos boletins diários e semanais para as últimas atualizações e conteúdos exclusivos sobre a cobertura de IA líder da indústria. Saiba…
Disrupt 2025: Os menores preços do ano terminam em 7 dias!
[the_ad id="145565"] Você leu corretamente! As melhores ofertas para ingressos do TechCrunch Disrupt 2025 estão prestes a acabar em apenas 7 dias. Economize até R$ 1.130 nos…