Inception, uma nova empresa com sede em Palo Alto, fundada pelo professor de ciência da computação da Stanford, Stefano Ermon, afirma ter desenvolvido um novo modelo de IA baseado em tecnologia de “difusão”. A Inception denomina isso de modelo de linguagem grande baseado em difusão, ou “DLM” para abreviar.
Os modelos de IA generativa que estão recebendo mais atenção atualmente podem ser amplamente divididos em dois tipos: modelos de linguagem grandes (LLMs) e modelos de difusão. Os LLMs são utilizados para geração de texto. Enquanto isso, os modelos de difusão, que alimentam sistemas de IA como o Midjourney e o Sora da OpenAI, são usados principalmente para criar imagens, vídeos e áudios.
O modelo da Inception oferece as capacidades dos LLMs tradicionais, incluindo geração de código e perguntas e respostas, mas com desempenho significativamente mais rápido e custos computacionais reduzidos, de acordo com a empresa.
Ermon disse ao TechCrunch que tem estudado como aplicar modelos de difusão ao texto por muito tempo em seu laboratório da Stanford. Sua pesquisa baseou-se na ideia de que os LLMs tradicionais são relativamente lentos em comparação com a tecnologia de difusão.
Com os LLMs, “você não pode gerar a segunda palavra até ter gerado a primeira, e não pode gerar a terceira até gerar as duas primeiras,” disse Ermon.
Ermon estava buscando uma maneira de aplicar uma abordagem de difusão ao texto porque, ao contrário dos LLMs, que trabalham de forma sequencial, os modelos de difusão começam com uma estimativa aproximada dos dados que estão gerando (por exemplo, uma imagem) e, depois, trazem os dados para foco de uma só vez.
Ermon hipotetizou que gerar e modificar grandes blocos de texto em paralelo era possível com modelos de difusão. Após anos de tentativas, Ermon e um de seus alunos alcançaram um grande avanço, que eles detalharam em um artigo de pesquisa publicado no ano passado.
Reconhecendo o potencial do avanço, Ermon fundou a Inception no verão passado, convocando dois ex-alunos, o professor da UCLA Aditya Grover e o professor da Cornell Volodymyr Kuleshov, para co-liderar a empresa.
Apesar de Ermon ter se recusado a comentar sobre o financiamento da Inception, o TechCrunch entende que o Mayfield Fund investiu na empresa.
A Inception já garantiu vários clientes, incluindo empresas sem nome da Fortune 100, ao atender à sua necessidade crítica de redução da latência da IA e aumento da velocidade, segundo Ermon.
“O que encontramos é que nossos modelos podem aproveitar as GPUs de maneira muito mais eficiente,” disse Ermon, referindo-se aos chips de computador comumente usados para rodar modelos em produção. “Acho que isso é um grande negócio. Isso vai mudar a forma como as pessoas constroem modelos de linguagem.”
A Inception oferece uma API, bem como opções de implantação em local e em dispositivos de borda, suporte para ajuste fino de modelos e um conjunto de DLMs prontos para uso em vários casos. A empresa afirma que seus DLMs podem operar até 10 vezes mais rápido do que os LLMs tradicionais enquanto custam 10 vezes menos.
“Nosso modelo de codificação ‘pequeno’ é tão bom quanto o [OpenAI’s] GPT-4o mini, mas mais de 10 vezes mais rápido,” disse um porta-voz da empresa ao TechCrunch. “Nosso modelo ‘mini’ supera pequenos modelos de código aberto como o [Meta’s] Llama 3.1 8B e alcança mais de 1.000 tokens por segundo.”
“Tokens” é o termo usado na indústria para bits de dados brutos. Mil tokens por segundo é uma velocidade impressionante, assumindo que as alegações da Inception se sustentem.
Conteúdo relacionado
OpenAI está supostamente em negociações para comprar a Windsurf por $3 bilhões, com novidades esperadas para esta semana.
[the_ad id="145565"] A Windsurf, fabricante de um popular assistente de codificação por IA, está em negociações para ser adquirida pela OpenAI por cerca de $3 bilhões, segundo…
A OpenAI procurou o criador do Cursor antes de iniciar negociações para comprar a Windsurf por $3 bilhões.
[the_ad id="145565"] Quando a notícia de que a OpenAI estava em negociações para adquirir a empresa de codificação AI Windsurf por $3 bilhões surgiu, uma das primeiras…
Como a IA está redesenhando os mapas de eletricidade do mundo: Insights do Relatório da AIE
[the_ad id="145565"] A inteligência artificial (IA) não está apenas transformando a tecnologia; ela também está mudando de forma significativa o setor energético global. De…