Bolt42

Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre coberturas de IA de ponta. Saiba mais


OpenAI anunciou hoje o lançamento público de seu software de geração de vídeo hiper-realista com IA, Sora — quase 10 meses após a sua primeira apresentação pública em fevereiro de 2024.

Na verdade, a OpenAI está lançando um modelo muito mais aprimorado em relação ao que foi apresentado naquela época: O novo Sora Turbo estará disponível em sora.com para assinantes pagantes do ChatGPT Plus e Pro ($20/mês ou $200/mês) nos EUA e na maioria dos países fora da UE e do Reino Unido.

O cofundador e CEO da OpenAI, Sam Altman, apresentou a notícia em uma transmissão ao vivo no YouTube, parte da série de anúncios temáticos de férias “12 Dias de OpenAI” programada para as 13h ET / 10h PT.

Sora pode gerar uma ampla gama de vídeos a partir de entradas de texto ou imagens estáticas, criando clipes com duração entre 10 e 20 segundos, em uma variedade de resoluções de 480p a 1080p, além de proporções de imagem que vão de paisagem a quadrada e vertical.

A OpenAI criou uma interface única para o produto, que inclui uma visualização em grade ou lista que o usuário pode alternar para ver suas gerações.

Os usuários também podem entrar em um modo chamado Storyboarding, que permite gerar vários clipes vinculados em uma visualização de linha do tempo. O modelo tenta fornecer uma transição suave entre os clipes — os usuários podem arrastar para fazer cortes mais abruptos ou tornar as tomadas mais longas e fluidas.

Os usuários do ChatGPT Plus podem gerar até 50 vídeos por mês em resolução 480p.

Para profissionais e usuários frequentes, o plano Pro oferece resoluções mais altas, durações mais longas e gerações ilimitadas em velocidades lentas.

A OpenAI também anunciou planos de liberar opções de preços personalizadas para diversas necessidades dos usuários até o início de 2025.

Notícia revelada por MKBHD

O popular YouTuber de tecnologia Marques Brownlee, mais conhecido pelo seu nome de usuário MKBHD, revelou a notícia do lançamento do Sora cerca de uma hora antes.

“Os rumores são verdadeiros — SORA, o gerador de vídeo da OpenAI, está lançando para o público hoje…” Brownlee escreveu em uma postagem na rede social X.

Brownlee também compartilhou uma thread de exemplos de vídeos que ele fez usando o gerador de texto/imagem/vídeo-para-vídeo, ao qual ele teve acesso antecipado como um entre vários parceiros criativos selecionados que a OpenAI recrutou para o programa antes do seu lançamento geral.

Brownlee compartilhou que, embora o Sora pudesse produzir vídeos impressionantes e às vezes assustadoramente realistas, como o de apresentadores de noticiários ou um revisor de gadgets como ele, também tende a alucinar detalhes aleatórios e a apresentar sinais característicos de ser gerado por IA, como texto confuso e sem sentido em legendas, física não natural e até adicionar ou remover objetos aparentemente de forma aleatória.

Ele também observou que a OpenAI impõe restrições bastante rigorosas contra a geração de semelhanças de pessoas reais e contra violência e temas explícitos.

Crédito: MKBHD/YouTube

Ainda assim, em sua análise no YouTube, ele também concluiu que “isso é muito para a humanidade digerir agora… [isso] é a nova linha de base, esta é mais uma vez a pior que já será.”

Vazamentos no Hugging Face em protesto por testadores iniciais

O lançamento segue um vazamento de Sora na comunidade de compartilhamento de código de IA Hugging Face por beta testers cerca de duas semanas atrás, em protesto sobre a gestão do programa de testes beta pela OpenAI. Como os vazadores escreveram em seu espaço no Hugging Face:

“Centenas de artistas fornecem trabalho não remunerado através de testes de bugs, feedback e trabalho experimental para o programa de uma empresa avaliada em $150 bilhões. Enquanto centenas contribuem de graça, alguns poucos serão escolhidos através de uma competição para ter seus filmes criados no Sora exibidos — oferecendo uma compensação mínima que é ínfima em comparação ao valor substancial de PR e marketing que a OpenAI recebe.”

O Sora também chega em meio a um cenário cada vez mais competitivo para a geração de vídeos realistas e de ação ao vivo. A Runway continua a atualizar rapidamente sua plataforma de geração de vídeo com novos recursos, incluindo, apenas na semana passada, a capacidade de regravar diálogos em filmagens preexistentes e fazer com que os rostos dos personagens correspondam. A Luma AI e concorrentes chineses como Kling, Hailuo, e recentemente, Tencent, também lançaram ferramentas impressionantes de geração de vídeo com IA nas últimas semanas.

Assim, embora a OpenAI — por conta de seu sucesso com o ChatGPT e as primeiras imagens atraentes do Sora — possa ter um forte reconhecimento que pode ajudar a popularizar o lançamento desse novo gerador de vídeo com IA para as massas, agora existem muitas opções concorrentes que parecem, pelo menos superficialmente, oferecer qualidade de vídeo semelhante ou melhor. Isso torna o Sora menos garantido como sucesso.





    7 + dezessete =




    Bolt42