Inscreva-se em nossos boletins diários e semanais para as últimas atualizações e conteúdos exclusivos sobre a cobertura líder da indústria em IA. Saiba mais
À medida que a Amazon dá um grande passo no espaço da IA com sua nova família de modelos de fundação Nova, o Google está intensificando suas próprias capacidades de IA multimodal. A divisão em nuvem da gigante da tecnologia anunciou que seus mais recentes modelos de geração de vídeo e imagem, Veo e Imagen 3, agora estão disponíveis no Vertex AI.
Essa iniciativa capacita equipes a integrar capacidades de ponta em geração de vídeo e imagem em seus fluxos de trabalho de IA, desbloqueando casos de uso diversos—especialmente em marketing e publicidade. Além disso, torna o Google Cloud o primeiro hiperescalador a oferecer um modelo de vídeo para seus clientes.
Enquanto o modelo Veo está atualmente em pré-visualização privada, o Imagen 3 estará disponível para todos os usuários do Vertex AI a partir da próxima semana. Notavelmente, o Imagen 3 também inclui recursos de edição, permitindo que os usuários refinem as imagens geradas para atender a necessidades criativas específicas.
O que o Veo e o Imagen 3 oferecem?
Primeiramente apresentado na conferência de desenvolvedores I/O do Google, o Veo é a resposta do Google DeepMind a concorrentes como o Gen-3 da Runway e o Sora da OpenAI, oferecendo uma experiência sofisticada de geração de vídeo. O modelo transforma prompts de texto ou imagem em vídeos cinematográficos de alta definição em vários estilos visuais, gerando clipes com mais de 60 segundos de duração. O que o diferencia é a consistência em nível de quadro, garantindo que os sujeitos se movam de forma suave dentro dos planos.
O Imagen 3, também do DeepMind, assume a tarefa de geração de texto para imagem, produzindo visuais fotorealistas em uma variedade de estilos. O Google afirma que ele supera seus antecessores em detalhes, precisão de iluminação e redução de artefatos.
Além da geração, os usuários na lista de permissão do Google também podem acessar opções avançadas de personalização com o Imagen 3. Isso inclui aumento de imagem, inpainting, outpainting e substituição de fundo—tudo guiado por prompts de texto. Além disso, os usuários podem fornecer imagens de referência, permitindo que o Imagen 3 crie conteúdo alinhado com estéticas de marca específicas, logotipos ou características de produtos.
Implicações mais amplas para a indústria
O Vertex AI tem sido há muito tempo a plataforma insignia do Google Cloud para agilizar o desenvolvimento e a implantação de aplicações de IA. Ao integrar Veo e Imagen 3, a plataforma oferece às organizações um conjunto ainda mais abrangente de ferramentas para inovar em marketing, vendas e além.
O Imagen 3, por exemplo, simplifica a criação de ativos de alta qualidade, como imagens de produtos e conteúdo para redes sociais, enquanto o Veo amplifica essa capacidade oferecendo às equipes uma opção para converter esses visuais em vídeos polidos. Isso acelera a produção, reduz custos e acelera o protótipo, permitindo que as equipes iterem rapidamente em suas estratégias criativas.
“Clientes como a Agoda estão utilizando o poder de modelos de IA como Veo, Gemini e Imagen para agilizar sua produção de anúncios em vídeo, alcançando uma redução significativa no tempo de produção,” afirmou Warren Barkley, diretor sênior de gerenciamento de produtos do Google, em um post de blog. Ele também destacou que ambos os modelos incluem recursos de segurança, como marca d’água digital e diretrizes de moderação de conteúdo para mitigar riscos associados à IA geradora.
Outros adotantes precoces incluem a Mondelez International— proprietária de marcas como Oreo, Cadbury e Milka— e o serviço global de marketing e comunicações WPP. À medida que os modelos de fundação do Google se expandem, empresas de diversos setores têm uma oportunidade poderosa de reimaginar como criam e entregam conteúdo visual.
A competição continua a esquentar
Enquanto todos os principais provedores de nuvem, incluindo Google Cloud, Amazon Web Services e Microsoft Azure, têm oferecido modelos de geração de imagens em suas respectivas plataformas de orquestração de IA, a geração de vídeo tem sido bastante rara até agora. O movimento do Google de lançar o Veo em pré-visualização privada hoje muda isso.
Curiosamente, logo após o anúncio do Veo, a AWS fez um grande anúncio no re:Invent com o Nova Reel, um modelo de fundação que gera vídeos de qualidade de estúdio de seis segundos a partir de prompts de texto e imagem.
Este modelo, junto com outros na família Nova, deve estar disponível via Amazon Bedrock, o serviço totalmente gerenciado da empresa projetado para simplificar a criação e implantação de aplicações de IA geradora.
A Microsoft, por sua vez, parece estar atrasada nessa categoria neste momento. Seu AI Foundry não inclui modelos para geração de vídeo. No entanto, esperamos que isso mude assim que o Sora da OpenAI chegar ao mercado.
VB Daily
Mantenha-se atualizado! Receba as últimas notícias na sua caixa de entrada diariamente
Ao se inscrever, você concorda com os Termos de Serviço do VentureBeat.
Obrigado por se inscrever. Confira mais newsletters do VB aqui.
Ocorreu um erro.
Conteúdo relacionado
O modelo o3 da OpenAI pode ser mais caro de operar do que originalmente estimado.
[the_ad id="145565"] Quando a OpenAI revelou seu modelo de IA “reasoning” o3 em dezembro, a empresa se uniu aos criadores do ARC-AGI, um benchmark projetado para testar IAs…
O ‘Modo Café’ da Zencoder é o futuro da programação: Aperte um botão e deixe a IA escrever seus testes unitários.
[the_ad id="145565"] Certainly! Below is the content rewritten in Portuguese while maintaining the original HTML structure and tags: <div> <div…
Uplimit eleva as apostas na aprendizagem corporativa com conjunto de agentes de IA que podem treinar 1.000 funcionários simultaneamente.
[the_ad id="145565"] Participe dos nossos boletins informativos diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de ponta. Saiba…