Bolt42

Participe de nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de ponta. Saiba mais


Lightricks, a empresa israelense por trás do aplicativo de edição de fotos viral Facetune, está lançando um esforço ambicioso para agitar o cenário de IA generativa. Hoje, a empresa anunciou o lançamento do LTX Video (LTXV), um modelo de IA de código aberto capaz de gerar cinco segundos de vídeo de alta qualidade em apenas quatro segundos. Ao tornar seu modelo de vídeo amplamente disponível, a Lightricks visa diretamente a crescente dominância de sistemas de IA proprietários de gigantes da tecnologia como OpenAI, Adobe e Google.

“Acreditamos que modelos fundamentais se tornarão uma commodity, e não se pode construir um negócio real em torno de modelos fundamentais,” disse Zeev Farbman, co-fundador e CEO da Lightricks, em uma entrevista exclusiva ao VentureBeat. “Se startups quiserem ter uma chance séria de competir, a tecnologia precisa ser aberta, e é essencial garantir que as melhores universidades do mundo tenham acesso ao seu modelo e adicionem capacidades em cima dele.”

Com processamento em tempo real, escalabilidade para vídeos de longa duração e uma arquitetura compacta que roda de forma eficiente, mesmo em hardware de consumo, o LTXV está preparado para tornar a tecnologia de vídeo generativo de nível profissional acessível a um público mais amplo—uma abordagem que pode interromper o status quo da indústria.

Como a Lightricks utiliza código aberto para desafiar gigantes da IA

A decisão da Lightricks de lançar o LTXV como código aberto é uma aposta calculada projetada para diferenciar a empresa em um mercado de IA generativa cada vez mais lotado. Com dois bilhões de parâmetros, o modelo foi projetado para rodar de forma eficiente em GPUs amplamente disponíveis, como a Nvidia RTX 4090, enquanto mantém alta fidelidade visual e consistência de movimento.

Esse movimento ocorre em um momento em que muitos modelos de IA líderes—desde o DALL-E da OpenAI até o Imagen do Google—estão trancados atrás de APIs, exigindo que desenvolvedores paguem pelo acesso. A Lightricks, por outro lado, aposta que a abertura fomentará a inovação e a adoção.

Farbman comparou o lançamento do LTXV ao lançamento dos modelos de linguagem Llama de código aberto da Meta, que rapidamente ganharam tração na comunidade de IA e ajudaram a Meta a se estabelecer em um espaço dominado pelo ChatGPT da OpenAI. “A lógica empresarial é que se a comunidade adotar, se as pessoas na academia adotarem, nós como empresa nos beneficiaremos muito com isso,” disse Farbman.

Diferente da Meta, que controla a infraestrutura sobre a qual seus modelos rodam, a Lightricks está focando exclusivamente no modelo, trabalhando com plataformas como Hugging Face para torná-lo acessível. “Não vamos ganhar dinheiro com esse modelo no momento,” enfatizou Farbman. “Algumas pessoas vão implantá-lo localmente em seu hardware, como um PC de jogos. O foco é a adoção.”

Vídeo de IA ultrarrápido: quebrando recordes de velocidade em hardware de consumo

A característica mais marcante do LTXV é sua velocidade. O modelo pode gerar cinco segundos de vídeo—121 quadros em resolução 768×512—em apenas quatro segundos em GPUs H100 da Nvidia. Mesmo em hardware de consumo, como a RTX 4090, o LTXV oferece desempenho quase em tempo real, tornando-se um dos modelos mais rápidos em sua categoria.

Essa velocidade é alcançada sem comprometer a qualidade. A arquitetura Diffusion Transformer do modelo garante um movimento suave e consistência estrutural entre os quadros, abordando uma limitação chave de modelos de geração de vídeo anteriores. Para estúdios menores, criadores independentes e pesquisadores, a capacidade de iterar rapidamente e gerar resultados de alta qualidade em hardware acessível é uma mudança radical.

“Quando você está esperando alguns minutos para obter um resultado, é uma experiência de usuário terrível,” disse Farbman. “Mas, uma vez que você recebe feedback rapidamente, você pode experimentar e iterar mais rápido. Você desenvolve um modelo mental sobre o que o sistema pode fazer, e isso desbloqueia a criatividade.”

A Lightricks também projetou o LTXV para suportar a produção de vídeos de longa duração, oferecendo aos criadores maior flexibilidade e controle. Essa escalabilidade, combinada com seus tempos de processamento rápidos, abre novas possibilidades para indústrias que vão desde jogos até e-commerce.

No campo dos jogos, por exemplo, o LTXV poderia ser usado para melhorar gráficos em jogos antigos, transformando-os em experiências visualmente deslumbrantes. No e-commerce, a velocidade e eficiência do modelo poderiam permitir que empresas criassem milhares de variações de anúncios para testes A/B direcionados.

“Imagine escalar um ator—real ou virtual—e ajustar os visuais em tempo real para encontrar a melhor criação para um público específico,” disse Farbman.

De aplicativo de fotos a potência de IA: a ousada jogada de mercado da Lightricks

Com o LTXV, a Lightricks está se posicionando como um disruptor em uma indústria cada vez mais dominada por um punhado de gigantes da tecnologia. Este é um movimento audacioso para uma empresa que começou como uma criadora de aplicativos móveis e é mais conhecida pelo Facetune, um aplicativo de edição de fotos para consumidores que se tornou um sucesso global.

A Lightricks expandiu suas ofertas, adquirindo a plataforma de marketing de influenciadores baseada em Chicago Popular Pays e lançando LTX Studio, uma plataforma de narrativa impulsionada por IA voltada para criadores profissionais. A integração do LTXV no LTX Studio deve aprimorar as capacidades da plataforma, permitindo que os usuários gerem vídeos mais longos e dinâmicos com maior velocidade e precisão.

Mas a Lightricks enfrenta desafios significativos. Concorrer contra pesos pesados da indústria como Adobe e Autodesk, que têm mais recursos financeiros e bases de usuários estabelecidas, não será fácil. A Adobe, por exemplo, já integrou IA generativa em seu Creative Cloud suite, dando-lhe uma vantagem natural entre os usuários profissionais.

Farbman reconhece os riscos, mas acredita que a inovação de código aberto é o único caminho viável para pequenos players. “Se você quiser ter uma chance de lutar como uma startup contra os gigantes, precisa garantir que a tecnologia é aberta e adotada pela academia e pela comunidade mais ampla,” disse ele.

Por que o código aberto pode vencer a corrida de geração de vídeo de IA

O lançamento do LTXV também destaca uma tensão crescente na indústria de IA entre abordagens de código aberto e proprietárias. Enquanto modelos fechados oferecem às empresas um controle mais rígido e oportunidades de monetização, eles correm o risco de alienar desenvolvedores e pesquisadores que não têm acesso a ferramentas de ponta.

“Parte do que está acontecendo no momento é que modelos de difusão estão se tornando um paradigma alternativo aos métodos clássicos na computação gráfica,” explicou Farbman. “Mas se você realmente quer construir alternativas, APIs definitivamente não são suficientes. Você precisa dar às pessoas—academia, indústria, entusiastas—modelos para testar e criar ideias novas e incríveis.”

A Lightricks planeja lançar o LTXV no GitHub e no Hugging Face, com uma fase inicial de “visualização comunitária” para permitir testes e feedback. O modelo será eventualmente lançado sob uma licença OpenRAIL, garantindo que derivados permaneçam abertos para uso acadêmico e comercial.

Para a Lightricks, as apostas são altas. A empresa está apostando não apenas no sucesso do LTXV, mas também na adoção mais ampla de modelos de IA abertos em um campo cada vez mais dominado por ecossistemas fechados.

“O futuro dos modelos abertos é brilhante,” disse Farbman com confiança.

Se essa visão se concretizar ainda está por ser visto. Mas ao disponibilizar sua tecnologia mais avançada gratuitamente, a Lightricks está enviando uma mensagem clara: na corrida para definir o futuro do vídeo de IA, a abertura e a colaboração podem ser a verdadeira vantagem competitiva.





    18 − dezesseis =




    Bolt42