As gigantes da tecnologia gostam de se gabar de modelos de IA com trilhões de parâmetros que requerem clusters de GPU massivos e caros. Mas Fastino está adotando uma abordagem diferente.
A startup baseada em Palo Alto afirma ter criado uma nova arquitetura de modelo de IA que é intencionalmente pequena e específica para tarefas. Os modelos são tão pequenos que são treinados com GPUs de jogos de baixo custo, avaliadas em menos de $100.000 no total, segundo a Fastino.
O método está atraindo atenção. A Fastino garantiu $17,5 milhões em financiamento semente liderado pela Khosla Ventures, famoso por ser o primeiro investidor de risco da OpenAI, como a Fastino conta exclusivamente ao TechCrunch.
Isso eleva o financiamento total da startup para quase $25 milhões. Ela arrecadou $7 milhões em novembro passado em uma rodada pré-seed liderada pelo braço de capital de risco da Microsoft, M12, e pela Insight Partners.
“Nossos modelos são mais rápidos, mais precisos e custam uma fração do custo de treinamento, superando os modelos de destaque em tarefas específicas,” diz Ash Lewis, CEO e cofundador da Fastino.
A Fastino construiu um conjunto de pequenos modelos que vende para clientes empresariais. Cada modelo foca em uma tarefa específica que uma empresa pode precisar, como redigir dados sensíveis ou resumir documentos corporativos.
A Fastino ainda não revela métricas ou usuários iniciais, mas afirma que seu desempenho tem impressionado os primeiros usuários. Por exemplo, devido ao seu tamanho reduzido, seus modelos conseguem fornecer uma resposta completa em um único token, disse Lewis ao TechCrunch, demonstrando a tecnologia que fornece uma resposta detalhada de uma só vez em milissegundos.
Evento TechCrunch
Berkeley, CA
|
5 de junho
RESERVE AGORA
Ainda é um pouco cedo para dizer se a abordagem da Fastino vai pegar. O espaço de IA empresarial está lotado, com empresas como Cohere e Databricks também promovendo IAs que se destacam em determinadas tarefas. E os fabricantes de modelos SATA focados em empresas, incluindo Anthropic e Mistral, também oferecem modelos pequenos. Não é segredo que o futuro da IA generativa para empresas provavelmente estará em modelos de linguagem menores e mais focados.
O tempo dirá, mas um voto de confiança antecipado da Khosla certamente não faz mal. Por enquanto, a Fastino diz que está focada em construir uma equipe de IA de ponta. Está mirando pesquisadores em laboratórios de IA de renome que não estão obcecados por construir o maior modelo ou superar os benchmarks.
“Nossa estratégia de contratação é muito focada em pesquisadores que talvez tenham um pensamento contrariante sobre como os modelos de linguagem estão sendo construídos atualmente,” diz Lewis.
Conteúdo relacionado
Última oportunidade para expor no TechCrunch Sessions: AI — não fique de fora!
[the_ad id="145565"] As inscrições estão quase encerradas, e você tem até 23:59 PT de hoje para reservar sua mesa de expositor na TechCrunch Sessions: AI, nosso evento de…
A ferramenta de pesquisa avançada do ChatGPT ganha um conector GitHub para responder perguntas sobre código
[the_ad id="145565"] OpenAI está aprimorando seu recurso de "pesquisa profunda" impulsionado por IA com a capacidade de analisar bases de código no GitHub. Na quinta-feira, a…
5 Estratégias que Diferenciam os Líderes em IA dos 92% que Ainda Estão Presos no Modo Piloto
[the_ad id="145565"] Participe de nossos boletins diários e semanais para receber as últimas atualizações e conteúdo exclusivo sobre a cobertura líder de IA no setor. Saiba…