A OpenAI está anunciando um novo modelo impressionante de texto para vídeo chamado Sora. Exemplos iniciais do que ele pode fazer estão se espalhando pela internet.
Sora é um modelo de IA que cria vídeos realistas a partir de um simples prompt textual. Mas o que tem atraído a atenção de todos é a aparente qualidade da saída: exemplos fornecidos pela OpenAI mostram o Sora gerando vídeos de até um minuto que parecem incrivelmente realistas e suaves.
Sora ainda não está disponível para o público. (Apenas um grupo selecto de “testadores” está avaliando o modelo para segurança.) Mas promete ter um grande impacto no mundo da geração de vídeo por IA.
Então, qual é a grande novidade sobre o Sora?
Eu obtive a resposta do fundador/CEO do Marketing AI Institute, Paul Roetzer, no Episódio 84 do The Artificial Intelligence Show.
Por que o Sora é importante?
“Estamos dizendo há algum tempo que 2024 seria o ano da IA para vídeo,” diz Roetzer. “Isso certamente parece estar se concretizando.”
A capacidade do Sora de produzir 60 segundos de vídeo é um salto incrível em relação a outras ferramentas líderes, como o Google Lumiere (5 segundos) e o Runway (16 segundos).
Ele também está superando ferramentas existentes de outras maneiras.
O Sora está claramente interpretando prompts complexos com um alto grau de precisão. (Embora a verdadeira prova venha quando todos nós tivermos acesso para testá-lo.)
O Sora também parece fazer um ótimo trabalho em garantir que os vídeos “persistam com precisão” ao longo de várias tomadas e takes prolongados, algo que geralmente é muito difícil para ferramentas de geração de vídeo por IA.
Surpreendentemente, o Sora também parece simular aspectos do mundo real que não aprendeu explicitamente—uma capacidade emergente.
“Estamos ensinando a IA a entender e simular o mundo físico em movimento, com o objetivo de treinar modelos que ajudem as pessoas a resolver problemas que requerem interação no mundo real.”
“Este ainda não é o momento do ChatGPT para vídeos de IA, mas é um grande marco,” diz Roetzer.
Isso pode eventualmente ter um efeito disruptivo nas profissões de vídeo.
Embora o Sora ainda não esteja disponível, a OpenAI disse que está concedendo acesso a alguns artistas visuais, designers e cineastas para entender como isso impactará os profissionais criativos.
As ferramentas não estão tirando empregos tão cedo. Mas a OpenAI claramente acredita que pode ter um impacto.
Hoje, o Sora gera 60 segundos de vídeo impressionante do zero, o que já é bastante impressionante…
Mas amanhã, ele pode gerar clipes ou filmes inteiros, trazendo uma imensa criatividade e disrupção para indústrias relacionadas a vídeos.
No final, tudo isso volta para a AGI.
“O Sora serve como base para modelos que podem entender e simular o mundo real, uma capacidade que acreditamos ser um marco importante para alcançar a AGI.”
AGI, ou inteligência geral artificial, refere-se à IA que é mais inteligente que os humanos em uma ampla gama de tarefas.
“Tudo na OpenAI sempre volta para a AGI,” diz Roetzer.
Conteúdo relacionado
Na Primeira Grande Ação de Marketing, OpenAI Torna o ChatGPT Gratuito para Estudantes Universitários
[the_ad id="145565"] Na sua primeira grande campanha de marca sob a direção da diretora de marketing (CMO) Kate Rouch, a OpenAI está se aproximando dos estudantes…
Stagwell Nomeia John Kahan como o Primeiro Diretor de IA
[the_ad id="145565"] A Stagwell, a holding que foi fundada há nove anos pelo presidente e CEO Mark Penn, anunciou a nomeação de John Kahan como seu primeiro diretor de IA.…
4 Principais Conclusões do Relatório Anual da WPP
[the_ad id="145565"] A WPP apresentou seu relatório anual, semanas após desapontar o mercado com resultados de lucros abaixo do esperado para 2024. Além dos números, o…