Bolt42

Participe de nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de referência do setor. Saiba mais


A disputa entre startups e grandes empresas, como Google e Meta, para oferecer ferramentas de criação de vídeo em IA atraentes entrou em uma nova fase.

Luma AI, uma startup fundada por ex-funcionários do Google e outros, está expandindo drasticamente seu modelo de vídeo em IA, Dream Machine, com uma nova interface, aplicativo móvel e um novo modelo base de geração de imagem. O modelo, Luma Photon, combina personalização, eficiência e poder criativo para ultrapassar os limites da criação de imagens e vídeos.

Agora disponível na web e no iOS, o novo Dream Machine busca mesclar simplicidade e sofisticação através de dispositivos de entrada por meio de uma interface conversacional intuitiva unificada.

Imagem promocional da nova interface desktop do Luma. Crédito: Luma AI

Com mais de 25 milhões de usuários registrados desde seu lançamento em junho de 2024, o Dream Machine está evoluindo para um serviço baseado em assinatura tanto para criadores casuais quanto para profissionais em indústrias como moda, marketing e produção cinematográfica.

“Construímos o Dream Machine como um parceiro visual de pensamento, impulsionado por um novo modelo de imagem chamado Luma Photon”, disse Amit Jain, CEO e cofundador da Luma AI, durante uma entrevista em vídeo com o VentureBeat. “Ele é criativo, inteligente e projetado para as pessoas que constroem nosso mundo — designers, criadores em moda, mídia e entretenimento.”

Imagem promocional do Dream Machine no iOS. Crédito: Luma AI

Uma nova abordagem para a criação visual

O Dream Machine tem como objetivo remover a complexidade tradicionalmente associada às ferramentas criativas. Os usuários podem simplesmente descrever suas ideias em linguagem natural ou fornecer imagens de referência para guiar os resultados da plataforma. Diferente da engenharia de prompt tradicional, que exige entradas precisas e técnicas, o Dream Machine é construído para uma interação intuitiva.

“Ao contrário da engenharia de prompt, onde você precisa elaborar cuidadosamente comandos específicos, o Dream Machine permite que você converse com ele como se estivesse falando com uma pessoa. Essa interface conversacional torna a edição e a criação intuitivas”, explicou Jain.

Os novos recursos de personalização da plataforma, incluindo solicitação de várias imagens e referências de personagens a partir de imagens únicas, permitem que os usuários tragam suas visões à vida com maior precisão e detalhes. Por exemplo, os designers podem fazer o upload de texturas, cores e outras pistas visuais para guiar os resultados do sistema.

“Com o Dream Machine, você pode dar a ele imagens de referência — cores, estruturas ou texturas — e ele combinará e iterará inteligentemente até que você obtenha exatamente o que deseja. É um divisor de águas para designers e criativos,” acrescentou Jain.

Os novos modos incluem um modo Brainstorm que permite que os usuários apliquem diferentes influências estilísticas às suas imagens e vídeos, bem como Boards de várias imagens e vídeos que podem ser compartilhadas entre membros da equipe e outros criadores, e “Concept Pills” que oferecem visuais estilísticos unificados pré-definidos que os usuários podem aplicar aos seus resultados de vídeo e imagem.

Personagens consistentes a partir de uma única imagem

A Luma AI imagina um futuro onde a criação visual seja tão simples e acessível quanto digitar texto. O Dream Machine preenche essa lacuna, tornando as avançadas ferramentas generativas utilizáveis para todos, desde hobbyistas até profissionais da indústria.

“Por que criar imagens e vídeos deveria ser tão difícil quanto usar as ferramentas da Adobe? Imagine se fazer texto fosse tão difícil — não haveria revolução digital. Pensamento visual deveria ser igualmente acessível,” argumentou Jain.

Além da acessibilidade, a plataforma introduz capacidades inovadoras para a criação de vídeos. Os usuários podem animar enredos com personagens consistentes derivadas de uma única imagem, abrindo novas portas para contar histórias.

“Agora você pode criar infinitas variações de uma pessoa a partir de apenas uma imagem. Essa consistência permite desenvolver todo enredos em vídeos com o mesmo personagem — algo que não existia na criação de vídeos até agora,” disse Jain.

Novo modelo de geração de imagem Photon

No coração desses avanços está o Luma Photon, o mais recente modelo base de imagem da empresa, que gera imagens ainda de alta qualidade a partir de prompts de texto — e inclui “textos embutidos de última geração”, algo que muitos outros modelos de geração de imagem ainda lutam para realizar de forma confiável.

O Photon é construído com base na arquitetura Universal Transformer da Luma, que a Luma afirma ser oito vezes mais rápida e mais eficiente em termos de custo do que modelos comparáveis.

Essa eficiência permite iterações rápidas sem comprometer a qualidade, tornando-o ideal para casos de uso de alta demanda.

“Nosso novo modelo Photon é o mais criativo e personalizável disponível atualmente. Ele se adapta em tempo real sem treinamento, usando uma arquitetura de transformação universal avançada,” explicou Jain.

Os desenvolvedores também podem aproveitar o poder do Photon através da API da Luma AI, que suporta transformações de texto para imagem, texto para vídeo e imagem para vídeo. A API garante privacidade para os dados dos usuários e oferece escalabilidade para produtos construídos em sua plataforma.

Nova precificação de assinatura

O atualizado Dream Machine é oferecido em quatro níveis de preços:

  • Hobbyistas: $9,99/mês
  • Exploradores: $29,99/mês
  • Profissionais: $99,99/mês
  • Enterprise: Preço personalizado para grandes equipes

Esses níveis oferecem flexibilidade para usuários com diferentes necessidades, seja criando para projetos pessoais ou empreendimentos comerciais.

Uma nova era de possibilidades

Desde sua fundação em 2021, a Luma AI arrecadou $80 milhões em financiamento de investidores estratégicos, incluindo Andreessen Horowitz, Amplify Partners, Matrix Partners, General Catalyst e South Park Commons.

Anjney Midha, um parceiro geral na Andreessen Horowitz, destacou o potencial da plataforma para impulsionar indústrias variando de geração de vídeo fotorrealista a criação de mundos 3D interativos.

À medida que o Dream Machine evolui, a Luma AI está cumprindo sua missão de democratizar a criatividade. “Dream Machine é onde você vem para visualizar o que está em sua cabeça. Ele ajuda a fazer sentido do mundo cada vez mais complexo aproveitando a capacidade da IA de processar e simplificar grandes quantidades de informações,” concluiu Jain.

Com sua combinação de acessibilidade, personalização e tecnologia de ponta, o Dream Machine está pronto para redefinir como as pessoas criam e compartilham suas ideias na era digital.

Correção: este artigo mencionou erroneamente a quantia que a Luma AI havia arrecadado e mencionou a Amazon como um investidor. O artigo foi atualizado com o número correto e a lista de investidores.





    dezesseis − 12 =




    Bolt42