Bolt42

Participe dos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre coberturas de IA líderes da indústria. Saiba Mais


Uma nova IA de aprendizagem foi deixada à sua própria sorte dentro de uma instância do Minecraft, enquanto a inteligência artificial aprende a jogar o jogo na prática, dizem a empresa de desenvolvimento de IA SingularityNET e a Aliança de Superinteligência Artificial (ASI Alliance). A IA, chamada AIRIS (Simbolismo Inferido de Reforço Inteligente Autônomo), está essencialmente começando do zero dentro do Minecraft para aprender a jogar o jogo usando apenas o feedback do ambiente do jogo para ensiná-la.

A IA já foi solta para aprender um jogo antes, mas frequentemente em espaços lineares 2D. Com o Minecraft, AIRIS pode entrar em um mundo 3D mais complexo e começar a navegar e explorar lentamente para descobrir o que pode fazer e, mais importante, se a IA consegue entender os objetivos de design do jogo sem que lhe sejam ditos. Como ela reage a mudanças no ambiente? Ela consegue descobrir diferentes caminhos para chegar ao mesmo lugar? Pode jogar o jogo com algo que lembre a criatividade que os jogadores humanos empregam no Minecraft?

A VentureBeat entrou em contato com a SingularityNET e a ASI Alliance para perguntar por que eles escolheram especificamente o Minecraft.

“Versões iniciais do AIRIS foram testadas em ambientes de jogos de quebra-cabeça 2D de grade simples,” respondeu um representante da empresa. “Precisávamos testar o sistema em um ambiente 3D que fosse mais complexo e aberto. O Minecraft se encaixa nessa descrição, é um jogo muito popular e possui todos os requisitos técnicos necessários para integrar uma IA. O Minecraft já é utilizado como um parâmetro de Aprendizado por Reforço. Isso nos permitirá comparar diretamente os resultados do AIRIS com algoritmos existentes.”

Eles também forneceram uma explicação mais detalhada sobre como funciona.

“O agente recebe dois tipos de entrada do ambiente e uma lista de ações que pode realizar. O primeiro tipo de entrada é uma grade 3D de 5 x 5 x 5 dos nomes dos blocos que cercam o agente. É assim que o agente “vê” o mundo. O segundo tipo de entrada é as coordenadas atuais do agente no mundo. Isso nos dá a opção de dar ao agente um local que queremos que ele alcance. A lista de ações nesta primeira versão inclui movimentar ou pular em uma das 8 direções (as quatro direções cardeais e diagonalmente) totalizando 16 ações. Versões futuras terão muitas mais ações à medida que expandimos as capacidades do agente para incluir mineração, colocação de blocos, coleta de recursos, combate a criaturas e criação de itens.

“O agente começa no modo ‘Exploração Livre’ e busca explorar o mundo ao seu redor. Ele constrói um mapa interno do que já viu, que pode ser visualizado com a ferramenta de visualização incluída. Ele aprende a navegar pelo mundo e, ao encontrar obstáculos como árvores, montanhas, cavernas, etc., aprende a se adaptar a eles. Por exemplo, se cair em uma caverna profunda, ele explorará uma maneira de sair. Seu objetivo é preencher qualquer espaço vazio em seu mapa interno, portanto, ele busca maneiras de alcançar lugares que ainda não viu.

“Se dermos ao agente um conjunto de coordenadas, ele parará a exploração livre e navegará para onde queremos que ele vá. Explorando áreas que nunca viu antes. Isso pode ser no topo de uma montanha, fundo de uma caverna, ou no meio de um oceano. Uma vez que chega ao seu destino, podemos dar a ele outro conjunto de coordenadas ou retorná-lo à exploração livre para explorar a partir de lá.

“A exploração livre e a capacidade de navegar por áreas desconhecidas é o que distingue o AIRIS de um Aprendizado por Reforço tradicional. Essas são tarefas que o RL não é capaz de realizar, independentemente de quantos milhões de episódios de treinamento ou quanta capacidade computacional você forneça.”

Para o desenvolvimento de jogos, um caso de uso bem-sucedido para o AIRIS pode incluir testes automáticos de bugs e estresse para software. Um hipotético AIRIS que pode percorrer toda a extensão de Fallout 4 poderia gerar relatórios de bugs ao interagir com NPCs ou inimigos, por exemplo. Embora os testadores de qualidade ainda precisem verificar o que a IA documentou, isso agilizaria um processo laborioso e geralmente frustrante para o desenvolvimento.

Além disso, é o primeiro passo em um mundo virtual para aprendizado autodirigido para IA em mundos complexos e omnidirecionais. Isso deve ser emocionante para entusiastas da IA como um todo.




    catorze + dez =




    Bolt42