A OpenAI está anunciando um novo modelo impressionante de texto para vídeo chamado Sora. Exemplos iniciais do que ele pode fazer estão se espalhando pela internet.
Sora é um modelo de IA que cria vídeos realistas a partir de um simples prompt textual. Mas o que tem atraído a atenção de todos é a aparente qualidade da saída: exemplos fornecidos pela OpenAI mostram o Sora gerando vídeos de até um minuto que parecem incrivelmente realistas e suaves.
Sora ainda não está disponível para o público. (Apenas um grupo selecto de “testadores” está avaliando o modelo para segurança.) Mas promete ter um grande impacto no mundo da geração de vídeo por IA.
Então, qual é a grande novidade sobre o Sora?
Eu obtive a resposta do fundador/CEO do Marketing AI Institute, Paul Roetzer, no Episódio 84 do The Artificial Intelligence Show.
Por que o Sora é importante?
“Estamos dizendo há algum tempo que 2024 seria o ano da IA para vídeo,” diz Roetzer. “Isso certamente parece estar se concretizando.”
A capacidade do Sora de produzir 60 segundos de vídeo é um salto incrível em relação a outras ferramentas líderes, como o Google Lumiere (5 segundos) e o Runway (16 segundos).
Ele também está superando ferramentas existentes de outras maneiras.
O Sora está claramente interpretando prompts complexos com um alto grau de precisão. (Embora a verdadeira prova venha quando todos nós tivermos acesso para testá-lo.)
O Sora também parece fazer um ótimo trabalho em garantir que os vídeos “persistam com precisão” ao longo de várias tomadas e takes prolongados, algo que geralmente é muito difícil para ferramentas de geração de vídeo por IA.
Surpreendentemente, o Sora também parece simular aspectos do mundo real que não aprendeu explicitamente—uma capacidade emergente.
“Estamos ensinando a IA a entender e simular o mundo físico em movimento, com o objetivo de treinar modelos que ajudem as pessoas a resolver problemas que requerem interação no mundo real.”
“Este ainda não é o momento do ChatGPT para vídeos de IA, mas é um grande marco,” diz Roetzer.
Isso pode eventualmente ter um efeito disruptivo nas profissões de vídeo.
Embora o Sora ainda não esteja disponível, a OpenAI disse que está concedendo acesso a alguns artistas visuais, designers e cineastas para entender como isso impactará os profissionais criativos.
As ferramentas não estão tirando empregos tão cedo. Mas a OpenAI claramente acredita que pode ter um impacto.
Hoje, o Sora gera 60 segundos de vídeo impressionante do zero, o que já é bastante impressionante…
Mas amanhã, ele pode gerar clipes ou filmes inteiros, trazendo uma imensa criatividade e disrupção para indústrias relacionadas a vídeos.
No final, tudo isso volta para a AGI.
“O Sora serve como base para modelos que podem entender e simular o mundo real, uma capacidade que acreditamos ser um marco importante para alcançar a AGI.”
AGI, ou inteligência geral artificial, refere-se à IA que é mais inteligente que os humanos em uma ampla gama de tarefas.
“Tudo na OpenAI sempre volta para a AGI,” diz Roetzer.
Conteúdo relacionado
40% das Compras Pmax de uma Marca de E-commerce Foram Exibidas em Sites MFA Criados por IA e Domínios Inativos
[the_ad id="145565"] A crescente presença de sites gerados por inteligência artificial voltados para a publicidade está dificultando a tarefa dos anunciantes em garantir que…
Como o Anúncio de Fim de Ano da Coca-Cola com IA Passou de Elogios a Raiva
[the_ad id="145565"] Inicialmente, o remake da Coca-Cola de seu comercial de 1995, “As Férias Estão Chegando,” alimentado por IA, parecia ser bem recebido. A System1, que testa…
Dentro da Estratégia de Dados Focada no Cliente de Chris Marino no Google
[the_ad id="145565"] No episódio deste podcast The Speed of Culture, o fundador e apresentador da Suzy, Matt Britton, conversa com Chris Marino, chefe de agência da Google…