Bolt42

O modelo de IA mais caro do Google parece ter alcançado um marco significativo: vencer um videogame de 29 anos.

Na noite passada, o CEO do Google, Sundar Pichai postou triunfante no X, “Que final! Gemini 2.5 Pro acaba de completar Pokémon Blue!”

Para deixar claro, a live stream Gemini Plays Pokemon foi criada por (em suas próprias palavras) “um engenheiro de software de 30 anos não afiliado ao Google” que se apresenta como Joel Z. No entanto, executivos do Google têm torcido por esse esforço.

Por exemplo, Logan Kilpatrick, o líder de produto do Google AI Studio, postou no mês passado que o Gemini estava “fazendo grandes progressos em completar Pokémon” e tinha “ganhado seu 5º emblema (o próximo melhor modelo só tem 3 até agora, embora com um agente diferente)”, levando Pichai a brincar, “Estamos trabalhando em uma API: Inteligência Artificial de Pokémon :)”

Por que Pokémon? Em fevereiro, a Anthropic destacou o progresso que seus modelos Claude estavam fazendo em “Pokémon Red”, afirmando que o “pensamento extendido e o treinamento de agentes” do Claude lhe dá “um grande impulso” em tarefas “mais inesperadas”, como jogar um clássico. (“Pokémon Red” e “Blue” são versões diferentes de um título do GameBoy lançado pela primeira vez em 1996 e ligado à longa franquia Pokémon). Há até um canal no Twitch Claude Plays Pokemon que Joel Z citou como inspiração.

Apesar do progresso, o Claude parece não ter vencido “Pokémon Red” ainda. Isso significa que o Gemini é objetivamente melhor no jogo? Em sua página do Twitch, Joel Z pediu aos espectadores, “Por favor, não considerem isso como um padrão de comparação para como um LLM pode jogar Pokémon. Não é possível fazer comparações diretas — Gemini e Claude têm ferramentas diferentes e recebem informações distintas.”

E ambos os modelos de IA precisam de ajuda para jogar — é aí que entram os referidos agentes de apoio, que fornecem aos modelos capturas de tela do jogo sobrepostas com informações adicionais, permitindo que o modelo decida como responder (o que pode envolver chamar agentes especializados) e então pressionar o botão correspondente à instrução da IA.

Evento Techcrunch

Berkeley, CA
|
5 de junho

RESERVE AGORA

Joel Z reconheceu que houve outras “intervenções de desenvolvedor” para ajudar o Gemini a completar o jogo, mas insistiu que isso não é trapaça.

“Minhas intervenções melhoram a capacidade de decisão e raciocínio do Gemini”, diz ele. “Não dou dicas específicas — não há guias ou instruções diretas para desafios particulares como Mt. Moon. A única coisa que se aproxima disso é avisar o Gemini que ele precisa falar com um Rocket Grunt duas vezes para obter a Chave Elevador, que era um erro que foi corrigido depois em Pokémon Yellow.”

Além disso, ele afirmou, “Gemini Plays Pokémon ainda está em desenvolvimento ativo, e a estrutura continua a evoluir.”


    20 + 9 =

    Bolt42