Bolt42

Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA líder do setor. Saiba Mais


Pesquisadores da Microsoft alcançaram o que muitos no campo da inteligência artificial consideravam um objetivo distante: ensinar à IA a entender e interagir com espaços tridimensionais da mesma forma que os humanos. Essa conquista se apresenta na forma de Muse, um modelo de IA que pode compreender e gerar sequências complexas de jogo, mantendo física e comportamentos de personagens consistentes.

O modelo, detalhado em um artigo publicado na Nature, aprendeu inteiramente a partir da observação de dados de jogabilidade humana — mais de sete anos de dados — do jogo da Xbox Bleeding Edge. Diferente dos modelos tradicionais de IA que trabalham com texto ou imagens estáticas, o Muse desenvolve o que os pesquisadores chamam de uma “compreensão prática” de como objetos, personagens e ambientes interagem no espaço tridimensional ao longo do tempo.

Três capacidades-chave do sistema de IA Muse da Microsoft: consistência na física, diversidade nos resultados e persistência das modificações do usuário. (Crédito: Microsoft)

Como a IA Muse da Microsoft vê, aprende e joga como um humano

“A arquitetura do modelo é agnóstica ao jogo; o único requisito é o acesso a um conjunto de dados apropriado,” disse Katja Hofmann, gerente de pesquisa sênior na Microsoft Research, em uma entrevista exclusiva ao VentureBeat. “Nós projetamos o modelo para usar o formato de dados mais geral, que chamamos de ‘interface humana’ de visuais e ações do controle.”

Essa abordagem permite ao Muse gerar sequências de jogo consistentes que duram até dois minutos — uma conquista técnica significativa na manutenção de interações coerentes em mundos 3D por períodos prolongados. O sistema pode utilizar apenas um segundo de visuais de jogo como entrada e gerar cenários complexos que respeitam a física do jogo e comportamentos dos personagens.

No entanto, existem limitações. “A resolução da imagem é fixa em 300×180 pixels,” disse Hofmann ao VentureBeat. “Há um trade-off entre tamanho do modelo e velocidade, o que significa que nossos maiores e mais consistentes modelos são também os mais lentos durante o tempo de inferência.”

Além dos jogos: como o Muse pode moldar a arquitetura, o varejo e a manufatura

O desenvolvimento do Muse foi moldado por extensas contribuições de criadores de jogos. Os pesquisadores da Microsoft entrevistaram 27 desenvolvedores de jogos globalmente, incluindo estúdios de países desenvolvidos e em desenvolvimento, para garantir que a tecnologia atendesse a verdadeiras necessidades criativas.

Além dos jogos, a Microsoft vê aplicações mais amplas para a tecnologia. Peter Lee, presidente da Microsoft Research, destacou em um post no blog usos potenciais em arquitetura, varejo e manufatura: “Desde reconfigurar a cozinha em sua casa até redesenhar um espaço de varejo, até a construção de um gêmeo digital de um piso de fábrica para testar e explorar diferentes cenários. Todas essas coisas estão se tornando possíveis agora com a IA.”

“A principal limitação para aplicações além dos jogos é o acesso a dados de alta qualidade,” disse Hofmann ao VentureBeat. “Os jogos são uma excelente área de aplicação para impulsionar avanços, porque grandes quantidades de dados de alta qualidade podem geralmente ser coletadas mais facilmente do que em outros ambientes 3D.”

Preservando a história dos videogames e capacitando futuros criadores

Para a indústria de jogos especificamente, a Xbox está explorando como essa tecnologia poderia ajudar a preservar jogos clássicos. “Graças a essa conquista, estamos explorando o potencial do Muse para pegar jogos mais antigos do nosso catálogo e otimizá-los para qualquer dispositivo,” disse Fatima Kardar, vice-presidente corporativa de IA de jogos na Microsoft, em um post no blog.

O modelo alcança três inovações técnicas-chave: mantendo a física e mecânicas de jogo coerentes ao longo de sequências prolongadas; gerando múltiplas continuações variadas, mas plausíveis, a partir do mesmo ponto de partida; e permitindo que os usuários modifiquem o conteúdo gerado mantendo essas mudanças de forma consistente.

“Estou pessoalmente fascinada pela capacidade do Muse de aprender uma compreensão detalhada de um complexo ambiente 3D apenas a partir da observação de dados de jogabilidade humana,” disse Hofmann. “Nossa pesquisa demonstra um passo empolgante em direção a novas experiências interativas criadas por criativos que são hiperpersonalizadas para e pelos seus jogadores.”

A Microsoft está liberando os pesos do modelo e uma ferramenta demonstradora para pesquisadores e criativos sob uma Licença de Pesquisa da Microsoft, embora isso ainda não seja uma oferta para clientes empresariais. Essa liberação visa incentivar mais pesquisa e exploração das capacidades da tecnologia.

O desenvolvimento sinaliza uma mudança mais ampla nas capacidades da IA: de entender conteúdo estático como texto e imagens para compreender ambientes dinâmicos 3D e interações humanas. Isso pode ter implicações de grande alcance para como projetamos e interagimos com espaços virtuais em várias indústrias.

À medida que a Microsoft avança para comercializar essa pesquisa, enfatiza que a criatividade humana permanece central. A tecnologia é posicionada como uma ferramenta assistiva, em vez de um substituto para os designers de jogos humanos, visando aumentar em vez de automatizar o processo criativo.





    dezessete + 18 =




    Bolt42