O Google está formando uma nova equipe para trabalhar em modelos de IA que podem simular o mundo físico.
Tim Brooks — um dos co-líderes do gerador de vídeo da OpenAI, Sora, que se transferiu para o laboratório de pesquisa em IA do Google, Google DeepMind, em outubro — liderará a nova equipe, como ele anunciou em uma postagem no X. A equipe fará parte do Google DeepMind.
“A DeepMind tem planos ambiciosos para criar modelos generativos massivos que simulam o mundo,” escreveu Brooks na manhã de segunda-feira. “Estou contratando para uma nova equipe com esta missão.”
De acordo com anúncios de emprego que Brooks linkou em sua postagem, a nova equipe de modelagem colaborará e ampliará o trabalho das equipes Gemini, Veo e Genie do Google para abordar “novos problemas críticos” e escalar modelos “para os mais altos níveis de computação.” O Gemini é a série de modelos de IA mais importante do Google para tarefas como análise de imagens e geração de texto, enquanto o Veo é o modelo de geração de vídeo do Google.
Quanto ao Genie, é a versão do Google de um modelo de mundo — IA que pode simular jogos e ambientes 3D em tempo real. O modelo mais recente do Genie, apresentado em dezembro, pode gerar uma enorme variedade de mundos 3D jogáveis.
“Acreditamos que escalar [o treinamento de IA] em dados de vídeo e multimodais está no caminho crítico para a inteligência geral artificial,” diz uma das descrições de trabalho. Inteligência geral artificial, ou AGI, refere-se geralmente a IA que pode realizar qualquer tarefa que um humano consegue. “Modelos de mundo alimentarão numerosos domínios, como raciocínio visual e simulação, planejamento para agentes corporificados e entretenimento interativo em tempo real.”
De acordo com a descrição, a nova equipe de Brooks procurará desenvolver ferramentas de “geração interativa em tempo real” com base nos modelos que eles constroem, e estudará como integrar seus modelos com modelos multimodais existentes, como o Gemini.
Várias startups e grandes empresas de tecnologia estão atrás de modelos de mundo, incluindo o World Labs da influente pesquisadora de IA Fei-Fei Lee, a startup israelense Decart e a Odyssey. Elas acreditam que modelos de mundo poderiam um dia ser usados para criar mídia interativa, como video games e filmes, além de realizar simulações realistas, como ambientes de treinamento para robôs.
Venha trabalhar com Tim e a equipe da DeepMind em modelos maciços de simulação do mundo : )
No caminho crítico para a AGI. https://t.co/4Zuju5eMHb
— Logan Kilpatrick (@OfficialLoganK) 6 de janeiro de 2025
Mas os criativos têm sentimentos mistos sobre a tecnologia.
Uma investigação recente da Wired descobriu que estúdios de jogos como a Activision Blizzard, que demitiu dezenas de trabalhadores, estão usando IA para cortar custos, aumentar a produtividade e compensar a rotatividade. E um estudo de 2024 encomendado pela Animation Guild, um sindicato que representa animadores e cartunistas de Hollywood, estimou que mais de 100.000 empregos na indústria de cinema, televisão e animação baseados nos EUA serão afetados pela IA até 2026.
Algumas startups no espaço ainda incipiente de modelagem de mundos, como a Odyssey, prometeram colaborar com profissionais criativos — e não substituí-los. Teremos que ver se o Google fará o mesmo.
Há também a questão não resolvida dos direitos autorais. Alguns modelos de mundo parecem estar sendo treinados com clipes de jogatinas de vídeo games, o que poderia tornar as empresas que desenvolvem esses modelos alvo de processos em casos onde os vídeos não foram licenciados.
O Google, que possui o YouTube, afirma que tem permissão para treinar seus modelos com vídeos do YouTube de acordo com os termos de serviço da plataforma. Mas a empresa não informou quais vídeos específicos está utilizando para treinamento.
A TechCrunch tem um boletim informativo focado em IA! Assine aqui para recebê-lo em sua caixa de entrada toda quarta-feira.
Conteúdo relacionado
SuperOps conquista R$ 125 milhões para usar IA e ajudar melhor provedores de serviços gerenciados
[the_ad id="145565"] SuperOps, uma startup indiana que oferece ferramentas para ajudar provedores de serviços de TI e administradores de sistemas internos em empresas, levantou…
A plataforma de música gratuita da Riffusion pode ser o Spotify do futuro
[the_ad id="145565"] Participe de nossas newsletters diárias e semanais para obter as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de ponta. Saiba Mais…
A startup de análise de dados Athenic AI quer ser o sistema nervoso central da empresa.
[the_ad id="145565"] Jared Zhao se interessou por análise de dados durante sua passagem pela UC Berkeley, atraído pela capacidade de transformar dados brutos em histórias. Zhao…