Bolt42

A World Labs, a startup fundada pela pioneira em IA Fei-Fei Li, revelou seu primeiro projeto: um sistema de IA capaz de gerar cenas em 3D, semelhantes a jogos, a partir de uma única imagem.

Diversos sistemas de IA podem transformar uma foto em modelos e ambientes 3D. No entanto, as cenas da World Labs são únicas, pois são interativas — e modificáveis.

“[Nossa tecnologia] permite que você entre em qualquer imagem e a explore em 3D,” a World Labs escreveu em um post no blog. “Além da imagem de entrada, tudo é gerado.”

World Labs
O sistema da World Labs converte uma imagem em uma cena 3D interativa e explorável. Créditos da Imagem:World Labs

As cenas geradas pela IA, que qualquer pessoa com um teclado e mouse pode explorar em uma demonstração no site da World Labs, são impressionantes, embora um pouco cartoonish. Elas são renderizadas ao vivo no navegador e têm uma câmera controlável com uma profundidade de campo (DoF) simulada ajustável. Quanto mais forte o efeito de DoF, mais borrados os objetos de fundo aparecem.

O sistema da World Labs faz parte de uma categoria emergente de IA chamada “módulos de mundo.” Muitos desses modelos podem simular jogos e ambientes em 3D — mas apresentam problemas de artefatos e consistência. Por exemplo, o modelo de mundo da startup Decart, Oasis, que simula o Minecraft, tem uma resolução baixa e rapidamente “esquece” o layout dos níveis.

Em contraste, a abordagem da World Labs garante que as cenas permaneçam as mesmas uma vez geradas e que obedeçam às leis básicas da física, o que significa que têm uma sensação de solidez e profundidade.

O sistema da World Labs também pode aplicar efeitos interativos e animações às cenas, como mudar a cor dos objetos e iluminar dinamicamente os fundos.

World Labs
Uma cena gerada pelo sistema da World Labs. Créditos da Imagem:World Labs

“A maioria das ferramentas de IA generativa cria conteúdo 2D, como imagens ou vídeos,” escreveu a World Labs. “Gerar em 3D, em vez disso, melhora o controle e a consistência. Isso mudará a forma como fazemos filmes, jogos, simuladores e outras manifestações digitais de nosso mundo físico.”

No entanto, há certamente espaço para melhorias. As cenas da World Labs não são totalmente exploráveis — seus movimentos estão limitados a uma pequena área. (Tente se mover para fora dela e você encontrará um limite.) E pode haver erros de renderização ocasionais — por exemplo, objetos que se misturam de maneiras não naturais.

Mas a World Labs afirma que isso é apenas uma “prévia inicial.”

“Estamos trabalhando arduamente para melhorar o tamanho e a fidelidade de nossos mundos gerados, além de experimentar novas maneiras para os usuários interagirem com eles,” escreveu a startup no blog.

World Labs
Parte da demonstração no site da World Labs. Efeitos podem ser aplicados às cenas em tempo real. Créditos da Imagem:World Labs

A World Labs, que foi lançada no início deste ano, arrecadou $230 milhões em capital de risco de investidores, incluindo Andreessen Horowitz (a16z), Ashton Kutcher, Intel Capital, AMD Ventures e Eric Schmidt. Avaliada em mais de $1 bilhão, a empresa espera ter seu primeiro produto pronto em 2025.

Além de cenas interativas, a World Labs planeja construir ferramentas que podem ser úteis para profissionais como artistas, designers, desenvolvedores, cineastas e engenheiros. Está direcionando seus produtos para clientes que variam de desenvolvedores de jogos a estúdios de cinema.

“Já temos a capacidade de criar mundos virtuais interativos, mas isso custa centenas e centenas de milhões de dólares e requer muito tempo de desenvolvimento,” disse o co-fundador da World Labs, Justin Johnson, em um recente episódio do podcast a16z. “[Modelos de mundo] permitirão que você não apenas obtenha uma imagem ou um clipe, mas um mundo 3D totalmente simulado, vibrante e interativo.”


    1 + 20 =

    Bolt42