Bolt42

O Google está formando uma nova equipe para trabalhar em modelos de IA que podem simular o mundo físico.

Tim Brooks — um dos co-líderes do gerador de vídeo da OpenAI, Sora, que se transferiu para o laboratório de pesquisa em IA do Google, Google DeepMind, em outubro — liderará a nova equipe, como ele anunciou em uma postagem no X. A equipe fará parte do Google DeepMind.

“A DeepMind tem planos ambiciosos para criar modelos generativos massivos que simulam o mundo,” escreveu Brooks na manhã de segunda-feira. “Estou contratando para uma nova equipe com esta missão.”

De acordo com anúncios de emprego que Brooks linkou em sua postagem, a nova equipe de modelagem colaborará e ampliará o trabalho das equipes Gemini, Veo e Genie do Google para abordar “novos problemas críticos” e escalar modelos “para os mais altos níveis de computação.” O Gemini é a série de modelos de IA mais importante do Google para tarefas como análise de imagens e geração de texto, enquanto o Veo é o modelo de geração de vídeo do Google.

Quanto ao Genie, é a versão do Google de um modelo de mundo — IA que pode simular jogos e ambientes 3D em tempo real. O modelo mais recente do Genie, apresentado em dezembro, pode gerar uma enorme variedade de mundos 3D jogáveis.

DeepMind Genie 2
Um mundo interativo e semelhante a um jogo gerado pelo modelo Genie 2 da DeepMind.Imagem Créditos: DeepMind

“Acreditamos que escalar [o treinamento de IA] em dados de vídeo e multimodais está no caminho crítico para a inteligência geral artificial,” diz uma das descrições de trabalho. Inteligência geral artificial, ou AGI, refere-se geralmente a IA que pode realizar qualquer tarefa que um humano consegue. “Modelos de mundo alimentarão numerosos domínios, como raciocínio visual e simulação, planejamento para agentes corporificados e entretenimento interativo em tempo real.”

De acordo com a descrição, a nova equipe de Brooks procurará desenvolver ferramentas de “geração interativa em tempo real” com base nos modelos que eles constroem, e estudará como integrar seus modelos com modelos multimodais existentes, como o Gemini.

Várias startups e grandes empresas de tecnologia estão atrás de modelos de mundo, incluindo o World Labs da influente pesquisadora de IA Fei-Fei Lee, a startup israelense Decart e a Odyssey. Elas acreditam que modelos de mundo poderiam um dia ser usados para criar mídia interativa, como video games e filmes, além de realizar simulações realistas, como ambientes de treinamento para robôs.

Mas os criativos têm sentimentos mistos sobre a tecnologia.

Uma investigação recente da Wired descobriu que estúdios de jogos como a Activision Blizzard, que demitiu dezenas de trabalhadores, estão usando IA para cortar custos, aumentar a produtividade e compensar a rotatividade. E um estudo de 2024 encomendado pela Animation Guild, um sindicato que representa animadores e cartunistas de Hollywood, estimou que mais de 100.000 empregos na indústria de cinema, televisão e animação baseados nos EUA serão afetados pela IA até 2026.

Algumas startups no espaço ainda incipiente de modelagem de mundos, como a Odyssey, prometeram colaborar com profissionais criativos — e não substituí-los. Teremos que ver se o Google fará o mesmo.

Há também a questão não resolvida dos direitos autorais. Alguns modelos de mundo parecem estar sendo treinados com clipes de jogatinas de vídeo games, o que poderia tornar as empresas que desenvolvem esses modelos alvo de processos em casos onde os vídeos não foram licenciados.

O Google, que possui o YouTube, afirma que tem permissão para treinar seus modelos com vídeos do YouTube de acordo com os termos de serviço da plataforma. Mas a empresa não informou quais vídeos específicos está utilizando para treinamento.

A TechCrunch tem um boletim informativo focado em IA! Assine aqui para recebê-lo em sua caixa de entrada toda quarta-feira.


    dezoito − 8 =

    Bolt42