O modelo de IA mais caro do Google parece ter alcançado um marco significativo: vencer um videogame de 29 anos.
Na noite passada, o CEO do Google, Sundar Pichai postou triunfante no X, “Que final! Gemini 2.5 Pro acaba de completar Pokémon Blue!”
Para deixar claro, a live stream Gemini Plays Pokemon foi criada por (em suas próprias palavras) “um engenheiro de software de 30 anos não afiliado ao Google” que se apresenta como Joel Z. No entanto, executivos do Google têm torcido por esse esforço.
Por exemplo, Logan Kilpatrick, o líder de produto do Google AI Studio, postou no mês passado que o Gemini estava “fazendo grandes progressos em completar Pokémon” e tinha “ganhado seu 5º emblema (o próximo melhor modelo só tem 3 até agora, embora com um agente diferente)”, levando Pichai a brincar, “Estamos trabalhando em uma API: Inteligência Artificial de Pokémon :)”
Por que Pokémon? Em fevereiro, a Anthropic destacou o progresso que seus modelos Claude estavam fazendo em “Pokémon Red”, afirmando que o “pensamento extendido e o treinamento de agentes” do Claude lhe dá “um grande impulso” em tarefas “mais inesperadas”, como jogar um clássico. (“Pokémon Red” e “Blue” são versões diferentes de um título do GameBoy lançado pela primeira vez em 1996 e ligado à longa franquia Pokémon). Há até um canal no Twitch Claude Plays Pokemon que Joel Z citou como inspiração.
Apesar do progresso, o Claude parece não ter vencido “Pokémon Red” ainda. Isso significa que o Gemini é objetivamente melhor no jogo? Em sua página do Twitch, Joel Z pediu aos espectadores, “Por favor, não considerem isso como um padrão de comparação para como um LLM pode jogar Pokémon. Não é possível fazer comparações diretas — Gemini e Claude têm ferramentas diferentes e recebem informações distintas.”
E ambos os modelos de IA precisam de ajuda para jogar — é aí que entram os referidos agentes de apoio, que fornecem aos modelos capturas de tela do jogo sobrepostas com informações adicionais, permitindo que o modelo decida como responder (o que pode envolver chamar agentes especializados) e então pressionar o botão correspondente à instrução da IA.
Evento Techcrunch
Berkeley, CA
|
5 de junho
RESERVE AGORA
Joel Z reconheceu que houve outras “intervenções de desenvolvedor” para ajudar o Gemini a completar o jogo, mas insistiu que isso não é trapaça.
“Minhas intervenções melhoram a capacidade de decisão e raciocínio do Gemini”, diz ele. “Não dou dicas específicas — não há guias ou instruções diretas para desafios particulares como Mt. Moon. A única coisa que se aproxima disso é avisar o Gemini que ele precisa falar com um Rocket Grunt duas vezes para obter a Chave Elevador, que era um erro que foi corrigido depois em Pokémon Yellow.”
Além disso, ele afirmou, “Gemini Plays Pokémon ainda está em desenvolvimento ativo, e a estrutura continua a evoluir.”
Conteúdo relacionado
Roblox inicia construção de data center no Brasil para início de 2026.
[the_ad id="145565"] No Gamescom Latam, a Roblox anunciou que está iniciando a construção de um novo data center no Brasil, previsto para entrar em operação no início de 2026.…
NVIDIA Cosmos: Potencializando a IA Física com Simulações
[the_ad id="145565"] O desenvolvimento de sistemas de IA física, como robôs em fábricas e veículos autônomos nas ruas, depende fortemente de grandes conjuntos de dados de alta…
Apple e Anthropic supostamente se uniram para criar uma plataforma de codificação de IA.
[the_ad id="145565"] A Apple e a Anthropic estão se unindo para criar uma plataforma de software chamada “vibe-coding” que utilizará inteligência artificial generativa para…