Bolt42

A OpenAI lançou sua ferramenta de geração de vídeos, Sora, na segunda-feira. No entanto, a empresa optou por não liberar um recurso chave para a maioria dos usuários até que mais testes sejam realizados.

O recurso em questão gera um vídeo usando uma foto carregada ou uma filmagem de uma pessoa real como referência. A OpenAI afirma que dará acesso a um “subconjunto” de usuários do Sora, mas que não disponibilizará amplamente essa capacidade até ter a oportunidade de aprimorar sua “abordagem à segurança”.

“A capacidade de gerar um vídeo usando uma foto ou vídeo carregado de uma pessoa real como o ‘semente’ é um vetor de possível uso indevido que estamos abordando de forma particularmente incremental para aprender com os padrões iniciais de uso”, escreveu a OpenAI em um postagem no blog. “O feedback inicial de artistas indica que essa é uma ferramenta criativa poderosa que eles valorizam, mas dado o potencial de abuso, não a estamos disponibilizando inicialmente para todos os usuários.”

A OpenAI também não permitirá que usuários compartilhem vídeos gerados contendo clipes ou imagens de pessoas reais no feed de descoberta da homepage do Sora.

“Obviamente, temos um grande alvo em nossas costas como OpenAI, então queremos prevenir atividades ilegais com o Sora, mas também queremos equilibrar isso com a expressão criativa”, disse Rohan Sahai, líder do produto Sora, durante uma apresentação ao vivo mais cedo hoje. “Sabemos que [isso será] um desafio contínuo — talvez não consigamos acertar tudo no primeiro dia. Estamos começando de forma conservadora, então, se nossa moderação não for perfeita, apenas nos dê esse feedback.”

O vídeo gerativo é uma ferramenta poderosa — e controversa, com deepfakes e desinformação sendo preocupações significativas. Segundo dados do serviço de verificação de ID Sumsub, a fraude com deepfakes no mundo aumentou mais de 10 vezes de 2022 para 2023.

Entre outras medidas que a OpenAI diz estar tomando para prevenir abusos, o Sora possui um filtro para detectar se um vídeo gerado retrata alguém com menos de 18 anos. Se sim, a OpenAI aplica um “limite mais rigoroso” para moderação relacionada a conteúdo sexual, violento ou de automutilação, afirma a empresa.

Todos os vídeos gerados pelo Sora contêm metadados que mostram sua origem — especificamente metadados que seguem o padrão técnico C2PA. Os metadados podem ser removidos, é verdade. Mas a OpenAI está promovendo isso como uma maneira para plataformas que suportam C2PA detectarem rapidamente se um vídeo se originou no Sora.

Em uma tentativa de evitar reclamações de direitos autorais, a OpenAI também afirma que está usando “reescrita de prompt” para evitar que o Sora gere vídeos no estilo de um criador vivo.

“Adicionamos reescritas de prompt que são projetadas para serem acionadas quando um usuário tenta gerar um vídeo no estilo de um artista vivo”, escreveu a empresa. “Optamos por adotar uma abordagem conservadora nesta versão do Sora enquanto aprendemos mais sobre como o Sora é utilizado pela comunidade criativa… Há uma longa tradição na criatividade de se basear nos estilos de outros artistas, mas apreciamos que alguns criadores possam ter preocupações.”

Vários artistas processaram empresas de IA, incluindo a OpenAI, por supostamente terem treinado em suas obras sem permissão para criar ferramentas de IA que reproduzem conteúdos em seus estilos únicos. As empresas, por sua vez, alegaram que a doutrina do uso justo as protege de reclamações de infração de direitos autorais e que os modelos de IA, de fato, não reproduzem.

Sobre o treinamento, a OpenAI só dirá que o Sora foi desenvolvido usando uma mistura de “conjuntos de dados diversos”, incluindo dados disponíveis publicamente, dados proprietários acessados por meio de parcerias com fornecedores de dados e conjuntos personalizados desenvolvidos internamente. No início deste ano, a ex-CTO da OpenAI, Mira Murati, não negou categoricamente que o Sora foi treinado com clipes do YouTube, em aparente violação da política de uso da plataforma de streaming de propriedade do Google.

De acordo com o vlogger de vídeos Marques Brownlee, que teve uma prévia do Sora, o sistema pode criar múltiplas variações de clipes de vídeo a partir de um prompt de texto ou imagem e editar vídeos existentes por meio de uma ferramenta de Re-mix. Uma interface Storyboard permite que os usuários criem sequências de vídeos; uma ferramenta Blend pega dois vídeos e cria um novo que preserva elementos de ambos; e opções de Loop e Re-cut permitem que os criadores ajustem e editem ainda mais seus vídeos e cenas.

Os assinantes dos planos ChatGPT Pro e Plus da OpenAI têm acesso ao Sora, o gerador de vídeo da OpenAI, hoje — mas apenas se viverem em certos países.


    5 × 5 =

    Bolt42