Inception, uma nova empresa com sede em Palo Alto, fundada pelo professor de ciência da computação da Stanford, Stefano Ermon, afirma ter desenvolvido um novo modelo de IA baseado em tecnologia de “difusão”. A Inception denomina isso de modelo de linguagem grande baseado em difusão, ou “DLM” para abreviar.
Os modelos de IA generativa que estão recebendo mais atenção atualmente podem ser amplamente divididos em dois tipos: modelos de linguagem grandes (LLMs) e modelos de difusão. Os LLMs são utilizados para geração de texto. Enquanto isso, os modelos de difusão, que alimentam sistemas de IA como o Midjourney e o Sora da OpenAI, são usados principalmente para criar imagens, vídeos e áudios.
O modelo da Inception oferece as capacidades dos LLMs tradicionais, incluindo geração de código e perguntas e respostas, mas com desempenho significativamente mais rápido e custos computacionais reduzidos, de acordo com a empresa.
Ermon disse ao TechCrunch que tem estudado como aplicar modelos de difusão ao texto por muito tempo em seu laboratório da Stanford. Sua pesquisa baseou-se na ideia de que os LLMs tradicionais são relativamente lentos em comparação com a tecnologia de difusão.
Com os LLMs, “você não pode gerar a segunda palavra até ter gerado a primeira, e não pode gerar a terceira até gerar as duas primeiras,” disse Ermon.
Ermon estava buscando uma maneira de aplicar uma abordagem de difusão ao texto porque, ao contrário dos LLMs, que trabalham de forma sequencial, os modelos de difusão começam com uma estimativa aproximada dos dados que estão gerando (por exemplo, uma imagem) e, depois, trazem os dados para foco de uma só vez.
Ermon hipotetizou que gerar e modificar grandes blocos de texto em paralelo era possível com modelos de difusão. Após anos de tentativas, Ermon e um de seus alunos alcançaram um grande avanço, que eles detalharam em um artigo de pesquisa publicado no ano passado.
Reconhecendo o potencial do avanço, Ermon fundou a Inception no verão passado, convocando dois ex-alunos, o professor da UCLA Aditya Grover e o professor da Cornell Volodymyr Kuleshov, para co-liderar a empresa.
Apesar de Ermon ter se recusado a comentar sobre o financiamento da Inception, o TechCrunch entende que o Mayfield Fund investiu na empresa.
A Inception já garantiu vários clientes, incluindo empresas sem nome da Fortune 100, ao atender à sua necessidade crítica de redução da latência da IA e aumento da velocidade, segundo Ermon.
“O que encontramos é que nossos modelos podem aproveitar as GPUs de maneira muito mais eficiente,” disse Ermon, referindo-se aos chips de computador comumente usados para rodar modelos em produção. “Acho que isso é um grande negócio. Isso vai mudar a forma como as pessoas constroem modelos de linguagem.”
A Inception oferece uma API, bem como opções de implantação em local e em dispositivos de borda, suporte para ajuste fino de modelos e um conjunto de DLMs prontos para uso em vários casos. A empresa afirma que seus DLMs podem operar até 10 vezes mais rápido do que os LLMs tradicionais enquanto custam 10 vezes menos.
“Nosso modelo de codificação ‘pequeno’ é tão bom quanto o [OpenAI’s] GPT-4o mini, mas mais de 10 vezes mais rápido,” disse um porta-voz da empresa ao TechCrunch. “Nosso modelo ‘mini’ supera pequenos modelos de código aberto como o [Meta’s] Llama 3.1 8B e alcança mais de 1.000 tokens por segundo.”
“Tokens” é o termo usado na indústria para bits de dados brutos. Mil tokens por segundo é uma velocidade impressionante, assumindo que as alegações da Inception se sustentem.
Conteúdo relacionado
ChatGPT se refere a usuários pelo nome sem solicitação, e alguns acham isso ‘estranho’
[the_ad id="145565"] Alguns usuários do ChatGPT notaram um fenômeno estranho recentemente: O chatbot ocasionalmente se refere a eles pelo nome enquanto raciocina sobre…
De ‘acompanhar’ a ‘nos acompanhar’: Como o Google silenciosamente assumiu a liderança em IA empresarial.
[the_ad id="145565"] Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de ponta. Saiba Mais Há…
Tudo o que você precisa saber sobre o chatbot de IA
[the_ad id="145565"] O ChatGPT, o chatbot de IA geradora de texto da OpenAI, conquistou o mundo desde seu lançamento em novembro de 2022. O que começou como uma ferramenta para…