As gigantes da tecnologia gostam de se gabar de modelos de IA com trilhões de parâmetros que requerem clusters de GPU massivos e caros. Mas Fastino está adotando uma abordagem diferente.
A startup baseada em Palo Alto afirma ter criado uma nova arquitetura de modelo de IA que é intencionalmente pequena e específica para tarefas. Os modelos são tão pequenos que são treinados com GPUs de jogos de baixo custo, avaliadas em menos de $100.000 no total, segundo a Fastino.
O método está atraindo atenção. A Fastino garantiu $17,5 milhões em financiamento semente liderado pela Khosla Ventures, famoso por ser o primeiro investidor de risco da OpenAI, como a Fastino conta exclusivamente ao TechCrunch.
Isso eleva o financiamento total da startup para quase $25 milhões. Ela arrecadou $7 milhões em novembro passado em uma rodada pré-seed liderada pelo braço de capital de risco da Microsoft, M12, e pela Insight Partners.
“Nossos modelos são mais rápidos, mais precisos e custam uma fração do custo de treinamento, superando os modelos de destaque em tarefas específicas,” diz Ash Lewis, CEO e cofundador da Fastino.
A Fastino construiu um conjunto de pequenos modelos que vende para clientes empresariais. Cada modelo foca em uma tarefa específica que uma empresa pode precisar, como redigir dados sensíveis ou resumir documentos corporativos.
A Fastino ainda não revela métricas ou usuários iniciais, mas afirma que seu desempenho tem impressionado os primeiros usuários. Por exemplo, devido ao seu tamanho reduzido, seus modelos conseguem fornecer uma resposta completa em um único token, disse Lewis ao TechCrunch, demonstrando a tecnologia que fornece uma resposta detalhada de uma só vez em milissegundos.
Evento TechCrunch
Berkeley, CA
|
5 de junho
RESERVE AGORA
Ainda é um pouco cedo para dizer se a abordagem da Fastino vai pegar. O espaço de IA empresarial está lotado, com empresas como Cohere e Databricks também promovendo IAs que se destacam em determinadas tarefas. E os fabricantes de modelos SATA focados em empresas, incluindo Anthropic e Mistral, também oferecem modelos pequenos. Não é segredo que o futuro da IA generativa para empresas provavelmente estará em modelos de linguagem menores e mais focados.
O tempo dirá, mas um voto de confiança antecipado da Khosla certamente não faz mal. Por enquanto, a Fastino diz que está focada em construir uma equipe de IA de ponta. Está mirando pesquisadores em laboratórios de IA de renome que não estão obcecados por construir o maior modelo ou superar os benchmarks.
“Nossa estratégia de contratação é muito focada em pesquisadores que talvez tenham um pensamento contrariante sobre como os modelos de linguagem estão sendo construídos atualmente,” diz Lewis.
Conteúdo relacionado
As Fissuras do Jardim Murado: Nadella Apostando na Interoperabilidade A2A/MCP dos Copilotos da Microsoft e no Próximo Ato do Azure
[the_ad id="145565"] Participe das nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura líder da indústria em IA. Saiba…
Sequoia lidera oferta de compra de $1,5 bilhão para a startup de automação de vendas Clay
[the_ad id="145565"] Kareem Amin, co-fundador e CEO da startup de automação de vendas Clay, levou sete anos de trabalho árduo para ver o produto da empresa finalmente decolar…
Exiba sua startup no TechCrunch Sessions: AI enquanto ainda é possível!
[the_ad id="145565"] Se você estava esperando o momento certo para agir, ele chegou. Você tem apenas 24 horas restantes para garantir sua mesa de exposição no TechCrunch…