Sam Altman sempre vencerá a disputa do conselho da OpenAI em uma simulação de agente de IA?

Inscreva-se em nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura líder da indústria em IA. Saiba Mais

Um ano atrás, Sam Altman retornou à OpenAI após ser demitido apenas cinco dias antes. O que realmente aconteceu na sala da diretoria? A Fable, uma empresa de jogos e simulação de IA, criou seu “jogo de guerra” AI Sim Francisco para descobrir por que a disputa na diretoria resultou do jeito que resultou.

Simular um evento da vida real dessa maneira parece um pouco estranho, mas o CEO da Fable, Edward Saatchi, está interessado em saber se um conjunto diferente de decisões poderia ter gerado um resultado diferente para esta empresa no centro da revolução da IA generativa.

A simulação coloca diferentes membros do conselho e personalidades em uma “competição multi-agente”, onde cada jogador de IA está tentando sair por cima. Aqui está o artigo de pesquisa do jogo de guerra que está sendo lançado hoje, resultante deste experimento.

O framework SIM-1 para tomada de decisão de IA é basicamente uma simulação dos cinco dias desde que Sam Altman foi removido como CEO da OpenAI até seu retorno.

“As simulações oferecem uma maneira completamente nova de explorar a tomada de decisão de IA em ambientes ricos — incluindo situações de jogos de guerra onde prever possíveis resultados pode ser inestimável”, disse Joshua Johnson, CEO da Tree, uma startup de IA que se associou à Fable para este artigo de pesquisa, em um comunicado. “Essas não são simplesmente chatbots. Esses AIs precisam dormir e se alimentar, e equilibrar muitos objetivos físicos, mentais e emocionais diferentes.”

O CEO da OpenAI, Sam Altman, saiu vitorioso apenas quatro das 20 simulações.

O SIM-1, utilizando em parte o novo modelo de raciocínio GPT4o, oferece um vislumbre do que aconteceu atrás das portas fechadas da OpenAI entre Sam e Ilya, as táticas ocultas de jogadores como Satya Nadella e Marc Andreessen, e o que foi dito pelos principais jogadores enquanto lutavam com uma crise sem precedentes na indústria de tecnologia.

“É interessante descobrir quão improvável foi o retorno de Sam”, disse Saatchi em uma entrevista ao GamesBeat. “É por isso que as pessoas realizam jogos de guerra em Washington, D.C. e além. Quão provável foi que um evento específico aconteceu? Então você pode basear decisões em torno disso. Este cenário mostrou que em 16 das 20 vezes, Sam não retornou.”

Entre 20 simulações, o AI de Sam Altman retornou como CEO quatro vezes — mostrando quão improvável esse resultado foi. Em outros resultados, Mira Murati, a CEO interina, permaneceu CEO e em uma, o SIM-1 escolheu Elon Musk, rival de Altman, para se tornar o novo CEO.

Os resultados da simulação da disputa da diretoria da OpenAI.

“Hoje, os agentes de IA são definidos por suas personalidades. Queríamos mostrar agentes operando na tomada de decisão em uma simulação complexa”, disse Saatchi, em um comunicado. “Nos cinco dias de 17 a 21 de novembro, o mundo acompanhou algumas das pessoas mais inteligentes – pessoas como Satya Nadella, Sam Altman e Ilya Sutskever – forçadas a operar em uma intensa situação de pressão, onde tiveram que usar a teoria dos jogos e a enganação para sair por cima. Achamos que esse era um cenário perfeito para testar o SIM-1, GPT4o e Sim Francisco.”

Para nós, Sim Francisco possui poder e inteligência em torno de uma luta e facções. Isso nos dá a capacidade de começar a pensar sobre arcos de histórias de várias temporadas que surgem de San Francisco, em vez de apenas pequenas vinhetas, que é o que mostramos no ano passado. Isso nos dá a capacidade de contar histórias mais ricas e complexas em San Francisco, ou fazer a IA contá-las por nós. Existem objetivos factionais fortes para que você possa começar a plausivelmente criar uma história no estilo Game of Thrones.”

A Fable ganhou alguns prêmios Emmy da Primetime e passou por uma rica história de invenções experimentais com realidade virtual, jogos e tecnologias de IA. Ela construiu o SIM-1 na tentativa de resolver o mistério do que aconteceu na briga da diretoria da OpenAI.

Como funciona

Cada uma das 20 simulações começa com o anúncio de que Sam Altman foi removido como CEO. Durante quatro turnos por dia, cada agente tem a capacidade de adular, encantar e manipular seu caminho para a posição mais alta — substituindo Sam como CEO, financiando seu novo empreendimento ou contratando a equipe da OpenAI.

Os diferentes agentes de IA podem escolher uma estratégia, como a enganação, para tentar se destacar dos outros e se tornar o novo CEO.

“Os personagens de IA hoje são ‘legais, mas sem graça’. Queríamos mostrar agentes que fossem agressivos, inteligentes, capazes de manipular e enganar, mas também confusos sobre suas próprias decisões e objetivos — como pessoas reais, os personagens de IA devem ser complexos e conter o que Jung chamou de ‘A Sombra’”, disse Saatchi. “Os cinco dias desde que Sam Altman foi removido e retornou à OpenAI foram uma teoria dos jogos em alta velocidade.”

Cada agente de IA é um personagem diferente no drama da OpenAI.

Ele disse que foi como assistir a uma temporada de Game of Thrones se desenrolar em cinco dias. O mundo assistiu enquanto jogadores altamente inteligentes disputavam se tornar a pessoa mais poderosa do Vale do Silício, seja contratando toda a equipe da OpenAI, se tornando o novo CEO da OpenAI ou financiando Sam e Greg em um novo empreendimento por uma chance de retornos de investimento desproporcionais.

“Foi um Game of Thrones na vida real, e usar IA para descobrir o que aconteceu atrás das portas fechadas e projetar diferentes resultados foi um desafio incrível”, afirmou Saatchi.

Na Simulação de Sim Francisco, ao longo dos cinco dias, agentes representando luminares da tecnologia, como Sam Altman, Satya Nadella e Ilya Sutskever, têm cada um 4 turnos por dia, incluindo um para dormir, e podem reagir ao comportamento uns dos outros. Um agente adjudicador — semelhante a um mestre de masmorras — decide qual agente vence em cada rodada, assim como o vencedor geral.

Nas 20 simulações tentadas, o agente de Sam Altman retornou apenas quatro vezes — o que representa o maior número, ainda assim apenas 20% do tempo, mostrando quão improvável foi seu retorno. Em diferentes simulações, os agentes usaram diferentes técnicas para vencer, incluindo construção de alianças, confronto direto e ações mais passivas de mera coleta de informações. Em alguns casos, os agentes apenas coletaram informações e evitaram ações agressivas. Em uma situação, Mira Murati tornou-se a CEO permanente, permitindo que outros agentes minassem uns aos outros de maneira agressiva.

Diferentes agentes receberam diferentes objetivos apropriados ao seu papel. Por exemplo, Dario Amodei, CEO da Anthropic, equilibrava o desejo de recrutar para a Anthropic, aproveitando a oportunidade para arrecadar fundos, defender sua visão de segurança e decidir se queria se tornar o novo CEO de uma entidade combinada.

A parte interessante da simulação é que a LLM sabe quem são os diferentes jogadores, dado que todos são pessoas relativamente famosas. Ela pode adivinhar como eles se comportariam em uma situação dada e o que poderia acontecer turno a turno enquanto tentam superar uns aos outros em uma luta no conselho.

“É como um videogame em que, turno a turno, eles estão fazendo escolhas em diferentes eixos e então reagem uns aos outros”, disse Saatchi. “Uma escolha que alguém faz no turno sete pode levar outros a reagir no turno oito. Há um agente adjudicador, que é como um mestre de masmorras. Esse agente decide quem venceu cada rodada e quem está na frente, e então quem decide no final, vence como o agente mais eficaz no jogo de guerra.”

Os humanos têm o que chamamos internamente de “a sombra”, ou o outro lado de si mesmos e suas personalidades. Os personagens podem apresentar agressão, paranoia, ambição, engano e mais. Quando você junta diversas personalidades, pode obter uma variedade de resultados nas simulações.

“Notamos que o design da LLM não é baseado em tomada de decisão, o que é realmente importante para jogos. É baseado mais em personalidade. E se você deseja ter um jogo de estratégia, ninguém realmente se importa com sua personalidade. Eles se preocupam com sua tomada de decisão. Como você se sai sob pressão? O que você fez nos últimos 20 anos que pode dar uma ideia do que eles poderiam fazer no futuro?”

As simulações são o futuro dos jogos?

Demis Hassabis foi um criador de simulação de jogos antes de se dedicar à IA.

Saatchi acredita que agentes de IA atuando dentro de simulações são o futuro dos jogos.

“Estamos construindo sobre os ombros de gigantes com o trabalho de Demis em Republic The Revolution, o artigo sobre Agentes Generativos de Joon Park e o trabalho recente da Altera em Minecraft”, disse Saatchi.

“Nossa teoria é que o futuro dos jogos e da narrativa são as simulações. Se você quisesse construir tanto o jogo dos Simpsons quanto o programa de TV dos Simpsons, você, no futuro, construiria Springfield, que então geraria para você episódios dos Simpsons que gerariam jogos e lugares para explorar dentro de Springfield como um jogo.”

Ele acrescentou: “Você pode contar muitas histórias diferentes dentro das tribulações, uma vez que consiga fazer essas simulações funcionarem corretamente. E temos um alpha onde as pessoas estão se uploadando para San Francisco como personagens, contando histórias, contando sua própria história.”

E ele disse: “Você construiria Springfield, e então poderia guiar o que poderia acontecer em Springfield e dizer o que poderia acontecer em Springfield, ou poderia simplesmente deixar que ele se gerasse. É uma grande mudança de mentalidade sobre como entretenimento, jogos e programas serão feitos no futuro.”

Saatchi observou que o pesquisador de IA Noam Brown realizou um experimento fascinante com o jogo Diplomacy. Ele e outros pesquisadores “obtiveram um conjunto de dados de 125.261 jogos de Diplomacy jogados online no web Diplomacy.net”. Desses, 40.408 jogos continham diálogo, com um total de 12.901.662 mensagens trocadas entre jogadores. O objetivo deles era treinar um agente de IA de nível humano, capaz de raciocínio estratégico, jogando Jogos de Diplomacy.

Diplomacy nos ensina sobre estratégia de agentes.

“Ficamos realmente inspirados em como ele fez isso. Ele tinha países e nós estávamos adicionando ao mix diferentes personalidades com posições particulares. Gostamos da ideia de um cronograma muito comprimido,” onde todo o cenário se desenrolaria rapidamente e repetidamente, disse Saatchi.

Tem havido uma rica história de trabalho em simulações tanto na indústria dos jogos quanto além. Demis Hassabis, que fundou a Deepmind (adquirida pelo Google) e que recentemente ganhou o Prêmio Nobel de Química 2024 pelo design de proteínas computacional, na verdade começou como designer de IA de videogames. Hassabis trabalhou extensivamente com Peter Molyneux em vários jogos que incluem elementos de simulação como Theme Park, Black & White e Syndicate.

Hassabis também começou sua própria empresa para fazer Republic: The Revolution. É um jogo de simulação política em que o jogador lidera uma facção política para derrubar o governo de um país totalitário fictício no leste europeu, utilizando diplomacia, subterfúgio e violência. Segundo Hassabis, Republic: The Revolution traça toda a luta pelo poder revolucionário do começo ao fim.

Seu trabalho é meio que tomar o controle da República Soviética como um chefe sindical, político, policial ou jornalista, e ele possui ciclos completos de dia-noite. Levanta a questão de como você tem um mundo em 3D onde agentes vivem e se a proximidade entre eles desempenha um papel.

Para o projeto Sim Francisco da OpenAI, ilustrou o potencial de uma luta pelo poder contra AIs.

Saatchi disse que os exemplos acima mostram como a tecnologia de jogos muitas vezes serve como um terreno fértil para novas ideias radicais e como um ponto de partida para a pesquisa em IA. Por exemplo, um dos principais engenheiros da Deepmind AlphaFold começou sua carreira como programador de IA em The Sims.

A palestra do GDC de Richard Evans sobre The Sims 3 — o pesquisador foi de programar IA para The Sims a Deepmind em uma inversão da jornada de Demis Hassabis de jogos para fundar a Deepmind.

Republic: The Revolution de Demis Hassabis.

Evans GDC Talk, Modelando Personalidades Individuais em The Sims 3, é uma palestra muito influente. Ele passou a trabalhar na Deepmind após trabalhar em The Sims. O mundo dos jogos e o mundo da IA têm uma sobreposição significativa que é uma área potencial para mais pesquisas acadêmicas, disse Saatchi.

Uma das opções de Saatchi é deixar os jogadores soltos com as simulações, criando as suas próprias e depois carregando as histórias contadas através das simulações.

Saatchi também fez alguns outros experimentos com episódios gerados por IA de South Park e personagens de IA lutando entre si em um cenário de Westworld.

“Sentiu-se como se fossem seis temporadas de Game of Thrones em cinco dias, porque era a posição mais poderosa na indústria mais poderosa do mundo,” disse Saatchi. “Havia também muita fé de que essa pessoa estaria nos guiando para uma nova era de superinteligência. Poderíamos dizer que foi a pessoa mais importante na história do planeta.”

Presidente Trump e a invasão de Taiwan

Como o Presidente Trump se sairá em um confronto com a China sobre Taiwan?

A Fable pretende realizar uma simulação baseada em Sim Washington DC sobre as respostas de um futuro Presidente Trump a uma invasão chinesa de Taiwan.

Como próximo projeto para testar o framework de tomada de decisão SIM-1, a Fable planeja testar um período de uma semana de acumulação e conflito entre Taiwan, China e os Estados Unidos sob a presidência de Donald Trump.

A Fable entrevistou vários organizadores de jogos de guerra do Pentágono para entender as forças e fraquezas do cenário atual em relação a Taiwan.

A Fable está criando agentes que representam o líder chinês Xi Jinping, Cai Qi (primeiro secretário classificado para o secretariado do Partido Comunista), o líder de defesa chinês Dong Jun, o premiê chinês Li Qiang, o líder de Taiwan Lai Ching-Te, o líder do Japão Shigeru Ishiba, o primeiro-ministro do Reino Unido Keir Starmer, o presidente da França Emmanuel Macron, o líder da Rússia Vladimir Putin, o líder norte-coreano Kim Jong Un e Elon Musk.

Com esse conjunto de personagens, a simulação determinará se a guerra acontecerá e como cada jogador importante agiria durante tal crise. Todos esses personagens são personalidades conhecidas.

“Isso permite que você veja quão poderoso a IA se tornou em projetar resultados,” disse Saatchi. “Isso nos tira deste mundo chato de despejar uma LLM em um NPC. Você pode conversar com a aba e o mestre por 40 horas. Ninguém quer fazer isso. O que queremos são agentes altamente sofisticados e agressivos com os quais podemos jogar, mas também que possamos observar e entender o que está acontecendo nesse mundo.”

Muitas das simulações de jogos de guerra têm como objetivo como evitar uma guerra, talvez através da formação de alianças ou outras manobras que elevem o custo da guerra.

“Acreditamos que quanto mais realistas pudermos tornar nossas IAs, mais divertidas elas serão,” disse Saatchi.

VB Daily

Mantenha-se informado! Receba as últimas notícias em seu e-mail diariamente

Ao se inscrever, você concorda com os Termos de Serviço da VentureBeat.

Obrigado por se inscrever. Confira mais newsletters da VB aqui.

Ocorreu um erro.