Bolt42

As gigantes da tecnologia gostam de se gabar de modelos de IA com trilhões de parâmetros que requerem clusters de GPU massivos e caros. Mas Fastino está adotando uma abordagem diferente.

A startup baseada em Palo Alto afirma ter criado uma nova arquitetura de modelo de IA que é intencionalmente pequena e específica para tarefas. Os modelos são tão pequenos que são treinados com GPUs de jogos de baixo custo, avaliadas em menos de $100.000 no total, segundo a Fastino.

O método está atraindo atenção. A Fastino garantiu $17,5 milhões em financiamento semente liderado pela Khosla Ventures, famoso por ser o primeiro investidor de risco da OpenAI, como a Fastino conta exclusivamente ao TechCrunch.

Isso eleva o financiamento total da startup para quase $25 milhões. Ela arrecadou $7 milhões em novembro passado em uma rodada pré-seed liderada pelo braço de capital de risco da Microsoft, M12, e pela Insight Partners.

“Nossos modelos são mais rápidos, mais precisos e custam uma fração do custo de treinamento, superando os modelos de destaque em tarefas específicas,” diz Ash Lewis, CEO e cofundador da Fastino.

A Fastino construiu um conjunto de pequenos modelos que vende para clientes empresariais. Cada modelo foca em uma tarefa específica que uma empresa pode precisar, como redigir dados sensíveis ou resumir documentos corporativos.

A Fastino ainda não revela métricas ou usuários iniciais, mas afirma que seu desempenho tem impressionado os primeiros usuários. Por exemplo, devido ao seu tamanho reduzido, seus modelos conseguem fornecer uma resposta completa em um único token, disse Lewis ao TechCrunch, demonstrando a tecnologia que fornece uma resposta detalhada de uma só vez em milissegundos.

Evento TechCrunch

Berkeley, CA
|
5 de junho

RESERVE AGORA

Ainda é um pouco cedo para dizer se a abordagem da Fastino vai pegar. O espaço de IA empresarial está lotado, com empresas como Cohere e Databricks também promovendo IAs que se destacam em determinadas tarefas. E os fabricantes de modelos SATA focados em empresas, incluindo Anthropic e Mistral, também oferecem modelos pequenos. Não é segredo que o futuro da IA generativa para empresas provavelmente estará em modelos de linguagem menores e mais focados.

O tempo dirá, mas um voto de confiança antecipado da Khosla certamente não faz mal. Por enquanto, a Fastino diz que está focada em construir uma equipe de IA de ponta. Está mirando pesquisadores em laboratórios de IA de renome que não estão obcecados por construir o maior modelo ou superar os benchmarks.

“Nossa estratégia de contratação é muito focada em pesquisadores que talvez tenham um pensamento contrariante sobre como os modelos de linguagem estão sendo construídos atualmente,” diz Lewis.


    16 + 14 =

    Bolt42