Dados tabulares é um termo amplo que abrange dados estruturados que geralmente se encaixam em uma linha e coluna específicas. Pode ser um banco de dados SQL, uma planilha, um arquivo .CSV, etc.
Embora tenha havido um progresso significativo na inteligência artificial aplicada a dados não estruturados e sequenciais, esses grandes modelos de linguagem são vagos por design. Eles são construídos para manipular tokens de entrada a fim de gerar uma saída coerente, sem necessariamente seguir uma estrutura fixa. Os melhores LLMs também são caros para acessar via API ou caros para serem executados em sua própria infraestrutura em nuvem.
No entanto, muitas empresas já possuem uma estratégia de dados com um armazém de dados ou lago de dados para centralizar todas as informações importantes, além de alguns cientistas de dados que podem utilizar esses dados para melhorar a estratégia da empresa.
A startup francesa Neuralk-AI é uma empresa de inteligência artificial que tem trabalhado em modelos de IA focados em dados tabulares. A empresa anunciou esta semana um financiamento de $4 milhões.
“Os dados com real valor para as empresas são dados que foram identificados há muito tempo, estruturados na forma de uma tabela e utilizados pelos cientistas de dados dessas empresas para criar todos os seus algoritmos de aprendizado de máquina,” disse Alexandre Pasquiou, co-fundador e Diretor Científico da Neuralk-AI, ao TechCrunch.
A Neuralk-AI acredita que há uma oportunidade em revisitar o desenvolvimento de modelos de IA, mas com um foco específico em dados estruturados. Inicialmente, planeja oferecer seu modelo como uma API para cientistas de dados que trabalham em empresas de comércio, pois essas empresas adoram dados — pense em catálogos de produtos, bancos de dados de clientes, tendências de carrinho de compras, etc.
“Hoje, os LLMs são ótimos para busca, interação natural com o usuário e responder perguntas baseadas em documentos não estruturados. Mas eles têm algumas limitações no momento em que voltamos ao aprendizado de máquina clássico, que é realmente baseado em dados tabulares clássicos,” disse Pasquiou.
Com a Neuralk-AI, os varejistas podem automatizar fluxos de trabalho de dados complexos com deduplicação e enriquecimento inteligentes. Mas eles também poderiam usar os modelos da empresa para detectar fraudes, otimizar recomendações de produtos e gerar previsões de vendas que poderiam ser usadas para gerenciamento de inventário e precificação de produtos.
A Fly Ventures liderou a rodada de $4 milhões da empresa, com a participação da SteamAI. Vários investidores anjo também contribuíram para a startup, como Thomas Wolf da Hugging Face, Charles Gorintin da Alan, e Philippe Corrot e Nagi Letaifa da Mirakl.
A equipe ainda está trabalhando ativamente em seus modelos. Ela planeja testar com um grupo de varejistas e startups de comércio francês, como E.Leclerc, Auchan, Mirakl e Lucky Cart.
“Dentro de três ou quatro meses, liberaremos a primeira versão do nosso modelo e o benchmark público no qual seremos capazes de classificar nosso modelo em comparação com o estado da arte neste espaço,” disse Pasquiou. “E em setembro, a ideia é ser o melhor modelo fundamental tabular em tudo relacionado a aprendizado de representação.”
Conteúdo relacionado
Treinamento de Agentes de IA em Ambientes Controlados os Fazem Exceler em Caos
[the_ad id="145565"] A maioria dos treinamentos de IA segue um princípio simples: alinhar suas condições de treinamento ao mundo real. Mas novas pesquisas do MIT estão…
StackAdapt do Canadá arrecada $235 milhões para sua plataforma programática baseada em IA
[the_ad id="145565"] Enquanto os Estados Unidos e o Canadá discutem sobre tarifas entre os dois países, uma empresa de tecnologia com sede em Toronto está anunciando uma rodada…
IA Acabou de Simular 500 Milhões de Anos de Evolução – E Criou uma Nova Proteína!
[the_ad id="145565"] A evolução tem aprimorado a vida em nível molecular por bilhões de anos. As proteínas, os blocos fundamentais da vida, evoluíram através desse processo…