Dados de alta qualidade podem ser a chave para uma IA de alta qualidade. Com estudos indicando que a curadoria de conjuntos de dados, e não seu tamanho, é o que realmente impacta o desempenho de um modelo de IA, não é surpreendente que haja uma ênfase crescente nas práticas de gerenciamento de conjuntos de dados. De acordo com algumas pesquisas, os pesquisadores em IA hoje passam a maior parte do tempo fazendo tarefas de preparação e organização de dados.
Os irmãos Vahan Petrosyan e Tigran Petrosyan sentiram na pele a dificuldade de gerenciar muitos dados enquanto treinavam algoritmos na faculdade. Vahan chegou a criar uma ferramenta de gerenciamento de dados durante sua pesquisa de doutorado sobre segmentação de imagens.
Alguns anos depois, Vahan percebeu que desenvolvedores — e até mesmo empresas — estariam dispostos a pagar por ferramentas semelhantes. Assim, os irmãos fundaram uma empresa, SuperAnnotate, para desenvolvê-las.
“Durante a explosão de inovação em 2023 em torno de modelos e IA multimodal, a necessidade de conjuntos de dados de alta qualidade se tornou mais restrita, com cada organização tendo múltiplos casos de uso que exigem dados especializados,” disse Vahan em uma declaração. “Vimos uma oportunidade de construir uma plataforma de baixo código, fácil de usar, como uma ferramenta multifuncional para os dados de treinamento de IA moderna.”
A SuperAnnotate, que tem clientes como Databricks e Canva, ajuda os usuários a criar e rastrear grandes conjuntos de dados para treinamento de IA. A startup inicialmente focou em software de rotulagem, mas agora fornece ferramentas para ajustar, iterar e avaliar conjuntos de dados.
Com a plataforma da SuperAnnotate, os usuários podem conectar dados de fontes locais e na nuvem para criar projetos de dados nos quais podem colaborar com colegas. A partir de um painel, os usuários podem comparar o desempenho de modelos de acordo com os dados usados para treiná-los e, em seguida, implantar esses modelos em vários ambientes uma vez que estejam prontos.
A SuperAnnotate também oferece às empresas acesso a um mercado de trabalhadores crowdsourced para tarefas de anotação de dados. As anotações geralmente são trechos de texto que rotulam o significado ou as partes dos dados que os modelos utilizam para treinamento, servindo como pontos de referência para os modelos, “ensinando-os” a distinguir coisas, lugares e ideias.
Para ser sincero, existem várias threads no Reddit sobre o tratamento da SuperAnnotate em relação aos anotadores de dados que utiliza, e não são elogiosas. Anotadores reclamam sobre problemas de comunicação, expectativas pouco claras e baixos salários.
Por sua parte, a SuperAnnotate afirma que paga taxas justas de mercado e que suas exigências sobre os anotadores não estão fora da norma para a indústria. Pedimos à empresa que fornecesse mais informações detalhadas sobre suas práticas e atualizaremos este artigo assim que recebermos uma resposta.
Existem vários concorrentes no espaço de gerenciamento de dados de IA, incluindo startups como Scale AI, Weka e Dataloop. A SuperAnnotate, baseada em San Francisco, conseguiu se manter firme, tendo recentemente levantado $36 milhões em uma rodada de Série B liderada pela Socium Ventures, com participação da Nvidia, Databricks Ventures, Play Time Ventures e Defy.vc.
O capital arrecadado, que eleva o total da SuperAnnotate para pouco mais de $53 milhões, será utilizado para aumentar sua equipe atual de cerca de 100 pessoas, para pesquisa e desenvolvimento de produtos, e para expandir a base de clientes da SuperAnnotate, que é composta por aproximadamente 100 empresas.
“Nosso objetivo é construir uma plataforma capaz de se adaptar completamente às necessidades em evolução das empresas e oferecer ampla personalização na afinação de dados,” disse Vahan.
Conteúdo relacionado
Um laboratório chinês lançou um modelo de IA de ‘raciocínio’ para rivalizar com o o1 da OpenAI.
[the_ad id="145565"] Um laboratório chinês revelou o que parece ser um dos primeiros modelos de IA de "raciocínio" a rivalizar com o o1 da OpenAI. Na quarta-feira, DeepSeek,…
H, a startup de IA que arrecadou R$ 220 milhões, lança seu primeiro produto: Runner H para aplicações ‘agenitcas’
[the_ad id="145565"] H, a startup parisiense fundada por ex-alunos do Google, causou um grande alvoroço no verão passado quando, de forma inesperada, anunciou uma rodada de…
Esta Semana em IA: Comissão do Congresso alerta sobre AGI da China
[the_ad id="145565"] Oi, pessoal, bem-vindos ao boletim informativo regular de IA da TechCrunch. Se você deseja recebê-lo em sua caixa de entrada todas as quartas-feiras,…