Bolt42

Inscreva-se em nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder no setor. Saiba mais


Lightricks, a empresa por trás de aplicativos criativos populares como Facetune e VideoLeap, anunciou hoje o lançamento do seu modelo de geração de vídeo AI mais poderoso até agora. O modelo LTX Video de 13 bilhões de parâmetros (LTXV-13B) gera vídeos AI de alta qualidade até 30 vezes mais rápido do que modelos comparáveis, enquanto roda em hardware de consumo, em vez de GPUs empresariais caras.

O modelo apresenta a “renderização em multiescalas”, uma abordagem técnica inovadora que aumenta dramaticamente a eficiência ao gerar vídeo em camadas progressivas de detalhes. Isso permite que criadores produzam vídeos AI de qualidade profissional em computadores desktop padrão e laptops de alto desempenho, em vez de exigir equipamentos empresariais especializados.

“A introdução do nosso modelo LTX Video de 13 bilhões de parâmetros marca um momento crucial na geração de vídeos AI, com a capacidade de gerar vídeos rápidos e de alta qualidade em GPUs de consumo,” disse Zeev Farbman, cofundador e CEO da Lightricks, em uma entrevista exclusiva ao VentureBeat. “Nossos usuários agora podem criar conteúdo com mais consistência, melhor qualidade e maior controle.”

Como a Lightricks democratiza vídeos AI resolvendo o problema da memória GPU

Um dos principais desafios para a geração de vídeos AI tem sido os enormes requisitos computacionais. Modelos líderes de empresas como Runway, Pika e Luma geralmente operam na nuvem em múltiplas GPUs empresariais com 80GB ou mais de VRAM (memória de vídeo), tornando a implementação local impraticável para a maioria dos usuários.

Farbman explicou como LTXV-13B aborda essa limitação: “A principal linha divisória entre GPUs de consumo e empresariais é a quantidade de VRAM. A Nvidia posiciona seu hardware de jogos com limites rígidos de memória — a geração anterior 3090 e 4090 atingia o limite de 24 gigabytes de VRAM, enquanto a mais nova 5090 chega a 32 gigabytes. O hardware empresarial, por comparação, oferece significativamente mais.”

O novo modelo é projetado para operar efetivamente dentro dessas restrições de hardware de consumo. “O modelo completo, sem nenhuma quantização, sem aproximações, você poderá rodar em GPUs de consumo topo de linha — 3090, 4090, 5090, incluindo suas versões para laptops,” observou Farbman.

Dentro da ‘renderização em multiescalas’: A técnica inspirada em artistas que torna a geração de vídeo AI 30X mais rápida

A inovação central por trás da eficiência do LTXV-13B é sua abordagem de renderização em multiescalas, que Farbman descreveu como “o maior avanço técnico deste lançamento.”

“Isso permite que o modelo gere detalhes gradualmente,” explicou. “Você começa na grade grosseira, obtendo uma aproximação rudimentar da cena, do movimento dos objetos, etc. Em seguida, a cena é dividida em tiles. E cada tile é preenchido com progressivamente mais detalhes.”

Esse processo espelha como os artistas abordam cenas complexas — começando com esboços grosseiros antes de adicionar detalhes progressivamente mais finos. A vantagem para a IA é que “sua quantidade máxima de VRAM é limitada pelo tamanho do tile, não pela resolução final,” disse Farbman.

O modelo também apresenta um espaço latente mais comprimido, que requer menos memória enquanto mantém a qualidade. “Com vídeos, você tem uma razão de compressão mais alta que permite que, enquanto você está no espaço latente, utilize menos VRAM,” adicionou Farbman.

Métricas de desempenho mostrando que o modelo LTXV-13B da Lightricks gera vídeo em apenas 37,59 segundos, em comparação com mais de 1.491 segundos para um modelo concorrente em hardware equivalente — uma melhoria de velocidade de quase 40×. (Crédito: Lightricks)

Por que a Lightricks aposta no código aberto quando os mercados de IA estão se tornando cada vez mais fechados

Embora muitos modelos de IA líderes permaneçam atrás de APIs fechadas, a Lightricks tornou o LTXV-13B totalmente de código aberto, disponível tanto no Hugging Face quanto no GitHub. Essa decisão ocorre em um período em que o desenvolvimento de IA de código aberto enfrenta desafios com a concorrência comercial.

“Um ano atrás, as coisas estavam fechadas, mas agora estão começando a se abrir. Estamos vendo muitos LLMs e modelos de difusão muito legais sendo abertos,” refletiu Farbman. “Estou mais otimista agora do que estava há seis meses.”

A estratégia de código aberto também ajuda a acelerar a pesquisa e a melhoria. “A principal razão para liberá-lo como código aberto é reduzir o custo de seu P&D,” explicou Farbman. “Há muitas pessoas na academia que usam o modelo, escrevem artigos, e você começa a se tornar um curador que entende onde está o verdadeiro valor.”

À medida que os desafios legais aumentam contra empresas de IA que utilizam dados de treinamento coletados, a Lightricks firmou parcerias com Getty Images e Shutterstock para acessar conteúdo licenciado para o treinamento do modelo.

“Coletar dados para treinar modelos de IA ainda é uma área cinzenta legalmente,” reconheceu Farbman. “Temos grandes clientes em nosso segmento empresarial que se preocupam com esse tipo de coisa, portanto, precisamos garantir que podemos fornecer modelos limpos para eles.”

Essas parcerias permitem que a Lightricks ofereça um modelo com risco legal reduzido para aplicações comerciais, potencialmente dando-lhe uma vantagem em mercados empresariais preocupados com questões de copyright.

A aposta estratégica: por que a Lightricks oferece seu modelo de IA avançado gratuitamente para startups

Em um movimento incomum para a indústria de IA, a Lightricks está oferecendo o LTXV-13B gratuitamente para licenciamento para empresas com menos de 10 milhões de dólares em receita anual. Essa abordagem visa construir uma comunidade de desenvolvedores e empresas que possam demonstrar o valor do modelo antes da monetização.

“O pensamento foi que a academia está livre. Esses caras podem fazer o que quiserem com o modelo,” disse Farbman. “Com startups e indústria, você quer criar situações vantajosas para todos. Não acho que você pode ganhar muito dinheiro com uma comunidade de artistas brincando com IA.”

Para empresas maiores que têm sucesso com o modelo, a Lightricks planeja negociar acordos de licenciamento similares ao que motores de jogos cobram de desenvolvedores bem-sucedidos. “Assim que atingirem dez milhões em receita, nós vamos conversar com eles sobre licenciamento,” explicou Farbman.

Apesar dos avanços representados pelo LTXV-13B, Farbman reconhece que a geração de vídeos AI ainda tem limitações. “Se fôssemos honestos conosco e olhássemos para os principais modelos, ainda estamos longe dos filmes de Hollywood. Eles ainda não chegaram lá,” disse ele.

No entanto, ele vê aplicações práticas imediatas em áreas como animação, onde profissionais criativos podem usar IA para lidar com aspectos demorados da produção. “Quando você pensa sobre os custos de produção de alta animação, o verdadeiro trabalho criativo, pessoas pensando em quadros-chave e na história, é uma pequena porcentagem do orçamento. Mas a definição de quadros-chave consome muitos recursos,” observou Farbman.

Olhando para o futuro, Farbman prevê que a próxima fronteira serão modelos de vídeo multimodais que integrem diferentes tipos de mídia em um espaço latente compartilhado. “Vai ser música, áudio, vídeo, etc. E então coisas como fazer uma boa sincronização labial serão mais fáceis. Todas essas coisas vão desaparecer. Você terá esse modelo multimodal que sabe operar em todas essas diferentes modalidades.”

O LTXV-13B está disponível agora como um lançamento de código aberto e está sendo integrado aos aplicativos criativos da Lightricks, incluindo sua plataforma de narração, LTX Studio.





    cinco × 2 =




    Bolt42