As novas arquiteturas de IA empresarial da Sapient visam superar os Transformers

Participe das nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA líder na indústria. Saiba Mais

Sapient Intelligence, a primeira startup de modelo de fundação em IA de Singapura, anunciou o fechamento bem-sucedido de sua rodada de financiamento seed, levantando 22 milhões de dólares a uma avaliação de 200 milhões de dólares.

Com o apoio de investidores proeminentes, incluindo Vertex Ventures, Sumitomo Group e JAFCO, a empresa espera traçar um caminho distinto no desenvolvimento de IA, abordando o que vê como falhas fundamentais nos modelos do tipo GPT.

“O objetivo da startup é realmente criar uma nova geração de arquiteturas de modelos fundamentais para resolver tarefas de raciocínio complexas e de longo prazo que são realmente desafiadoras para os grandes modelos de linguagem (LLMs), especialmente para as arquiteturas GPT, resolver”, disse o cofundador e CEO Austin Zheng em uma recente entrevista ao VentureBeat realizada por videoconferência.

Novas arquiteturas além dos Transformers tradicionais

Os modelos tradicionais do tipo GPT dependem de métodos autoregressivos, que geram previsões construindo sequencialmente sobre as saídas anteriores.

Embora sejam eficazes para tarefas gerais, essa abordagem enfrenta dificuldades em raciocínios de múltiplas etapas e resolução de problemas complexos.

“Com os modelos atuais, todos são treinados com um método autoregressivo, e com isso, o benefício é que é mais fácil para o modelo convergir em [uma] tarefa geral”, explicou Zheng. “Então parece realmente inteligente, podendo resolver muitas tarefas diferentes. Tem uma boa capacidade de generalização, mas é realmente, realmente difícil para eles resolver… tarefas complicadas e de longo prazo, de múltiplas etapas. E é aí que entra a alucinação.”

A resposta da Sapient é uma nova arquitetura de modelo inspirada na neurociência e na matemática, misturando componentes de Transformer com estruturas de rede neural recorrente e imitando como o cérebro humano funciona.

“O modelo sempre avaliará a solução, avaliará opções e fornecerá [a você] um modelo de recompensa com base nisso”, disse Zheng. “E também o modelo pode calcular continuamente algo de forma recorrente até chegar a uma solução correta. Com isso, nosso agente será capaz de se implantar em um ambiente empresarial ou [um] ambiente de produção, e aprender e melhorar continuamente… por tentativa e erro e aprender a ser um especialista na base de código existente.”

Esse design sustenta a flexibilidade e o poder dos modelos da Sapient, permitindo que eles enfrentem uma ampla gama de tarefas com precisão e confiabilidade.

Isso também coloca a empresa em competição com a nova geração de modelos de raciocínio da OpenAI com sua série o1, bem como outros concorrentes chineses.

Excelência em benchmarks e além

As inovações da empresa são refletidas no desempenho de benchmarks.

“O primeiro benchmark que usamos é na verdade o Sudoku,” disse Zheng ao VentureBeat. “Atualmente, nosso modelo é a melhor rede neural em termos de resolução de Sudoku no mercado – 95% de precisão sem usar ferramentas e dados intermediários.”

De acordo com Zheng, enquanto outros modelos líderes precisavam ser treinados em etapas intermediárias para resolver o popular quebra-cabeça de ordenação numérica, a Sapient forneceu ao modelo apenas tabuleiros de Sudoku não finalizados, as regras e as soluções finais, obrigando-o a inferir por conta própria como resolvê-los por meio de tentativa e erro.

Da mesma forma, os modelos da Sapient se destacaram em tarefas como navegação bidimensional e resolução de problemas matemáticos complexos, superando consistentemente abordagens concorrentes.

O treinamento desses modelos é outra área em que a Sapient se diferencia. “Ao contrário dos modelos tradicionais que exigem grandes quantidades de dados de alta qualidade, passo a passo, nossa abordagem precisa apenas de pares de pergunta e resposta. Isso reduz significativamente a barreira para o treinamento de modelos complexos”, disse Zheng.

Ao aproveitar dados sintéticos, a Sapient reduz a dependência de conjuntos de dados curados, criando pipelines de treinamento escaláveis e eficientes.

Aplicações práticas: De código a robôs

O foco inicial da Sapient está em aplicações do mundo real, começando com codificação empresarial e robótica.

Seus agentes de codificação autônoma visam revolucionar a forma como as empresas gerenciam suas necessidades de desenvolvimento e manutenção de software.

A empresa já está implantando um agente de codificação em IA autônomo nos ambientes empresariais da Sumitomo para aprender a base de código da empresa e, em última instância, começar a mantê-la e contribuir para ela.

A Sapient pretende oferecer um serviço semelhante a outros clientes empresariais, o que Zheng descreve como “funcionários de IA inteligentes e personalizados e engenheiros de software de IA que podem ajudá-los a manter, atualizar e também expandir as pilhas tecnológicas existentes.”

Diferente do Devin da Cognition, alimentado por GPT-4o, a Sapient acredita que seus agentes de IA para codificação poderão trabalhar autonomamente — sem qualquer intervenção humana guiando o processo ou solucionando problemas, exceto supervisores que verificam o trabalho antes de ser colocado em produção.

A empresa também está avançando em IA incorporada, projetando modelos que permitem que robôs interajam, aprendam e se adaptem em tempo real.

“Existem apenas algumas startups trabalhando na compreensão de [um] ambiente, e também no planejamento de opções e tarefas, além de entender quais tipos de tarefas são possíveis — também melhorando continuamente sua compreensão do ambiente, do problema e dos casos de uso,” ressaltou Zheng. “Esse será nosso foco principal para os próximos um a dois anos.”

Uma visão global

A Sapient está se destacando não apenas por meio da tecnologia, mas também por sua abordagem global e inclusiva.

“Existem pouquíssimas startups de IA em nível de modelo fundamental fora da China, realmente lideradas por fundadores asiáticos,” destacou Zheng. “Queremos realmente nos posicionar como uma organização internacional e orientada para a pesquisa. Além disso, desejamos ser uma das primeiras, poucas organizações de pesquisa internacionais lideradas por asiáticos que estão solucionando problemas realmente desafiadores, e estamos vendo isso se concretizando também.”

Com escritórios em Singapura e planos para a área da Baía, a empresa está construindo um laboratório de pesquisa em IA para reunir perspectivas e talentos diversos.

Seu time reflete essa ética, composto por cientistas e engenheiros de instituições líderes como DeepMind, Anthropic e Microsoft AI.

Essa diversidade, combinada com parcerias sólidas com investidores japoneses como o Sumitomo Group, posiciona a Sapient como um jogador único no ecossistema global de IA.

Direcionando-se a indivíduos e empresas

A visão de longo prazo da Sapient é ambiciosa, visando tecnologias que possam ser aplicadas com resultados igualmente úteis para indivíduos e empresas.

“O objetivo final será construir um agente verdadeiramente generalizado que possa resolver uma tarefa do dia a dia para nossos usuários — uma ‘solução para todos os agentes’ para um assistente pessoal e para resolver todas as suas tarefas… É aí que estamos em termos de nosso objetivo tecnológico e também nossa direção,” disse Zheng.

Isso inclui produtos futuros voltados para o público, como agentes de codificação autônomos e assistentes pessoais de uso geral.

No momento, a Sapient está focada em refinar sua tecnologia e entregar soluções de nível empresarial. Modelos de preços ainda estão sendo explorados, mas podem incluir taxas de licenciamento, taxas de assinatura ou encargos baseados em tarefas vinculadas a conclusões bem-sucedidas.

À medida que a Sapient expande suas operações e capacidades, continua sendo uma empresa para se observar no rapidamente evolutivo cenário de IA.

VB Daily

Fique por dentro! Receba as últimas notícias na sua caixa de entrada diariamente

Ao se inscrever, você concorda com os Termos de Serviço da VentureBeat.

Obrigado por se inscrever. Confira mais newsletters da VB aqui.

Ocorreu um erro.

Conteúdo relacionado

BusinessInteligência artificial

OpenAI está supostamente em negociações para comprar a Windsurf por $3 bilhões, com novidades esperadas para esta semana.

[the_ad id="145565"] A Windsurf, fabricante de um popular assistente de codificação por IA, está em negociações para ser adquirida pela OpenAI por cerca de $3 bilhões, segundo…

BusinessInteligência artificial

A OpenAI procurou o criador do Cursor antes de iniciar negociações para comprar a Windsurf por $3 bilhões.

[the_ad id="145565"] Quando a notícia de que a OpenAI estava em negociações para adquirir a empresa de codificação AI Windsurf por $3 bilhões surgiu, uma das primeiras…

Inteligência artificial

Como a IA está redesenhando os mapas de eletricidade do mundo: Insights do Relatório da AIE

[the_ad id="145565"] A inteligência artificial (IA) não está apenas transformando a tecnologia; ela também está mudando de forma significativa o setor energético global. De…