A OpenAI acaba de anunciar um modelo totalmente novo que pode ter cruzado um grande limiar nas capacidades da IA—e isso está gerando muitas conversas.
O modelo em questão se chama o3. E sim, você leu certo. Eles pularam o o2 completamente (devido a alguns conflitos de copyright reportados). Deixando a confusão de nomenclatura de lado, o3 é uma sequência direta do modelo avançado de raciocínio da OpenAI, o o1.
Mas, ao contrário do o1, o o3 acaba de superar o desempenho humano em um teste de inteligência notoriamente desafiador, marcando mais um avanço na corrida para construir IA mais inteligentes e capazes.
Eu conversei sobre o que isso significa com Paul Roetzer, fundador e CEO do Marketing AI Institute, no Episódio 129 de The Artificial Intelligence Show.
O Que É o o3?
O o3 é um modelo de IA projetado para fazer uma coisa muito bem: pensar profundamente sobre problemas antes de responder. Essa abordagem de “cadeia de pensamento” apareceu pela primeira vez no o1, mas o o3 é construído para levar o raciocínio adiante, gastando ainda mais tempo e recursos computacionais nos problemas mais difíceis.
E parece que está funcionando.
O o3 se tornou o primeiro modelo a superar humanos em um teste de inteligência especializado criado pelo proeminente pesquisador de IA François Chollet. O teste é chamado de ARC-AGI. Ele usa quebra-cabeças visuais simples para medir a capacidade de aprender e se adaptar a ambientes e situações totalmente novos—sem conhecimento prévio necessário. Os humanos pontuam cerca de 75% no teste. O o3 pontuou 76%.
Isso pode não parecer uma grande diferença, mas é impressionante quando você descobre que o GPT-4, um modelo de linguagem de última geração, basicamente pontuou quase zero no mesmo teste.
Chollet, que historicamente tem sido cético em relação ao exagero da IA, chamou o desempenho do o3 de “um aumento surpreendente e importante nas capacidades da IA”.
Por Que Isso É Importante
Para contextualizar, superar o desempenho humano no ARC-AGI não se trata de memorizar fatos ou dados. Trata-se de raciocínio. É sobre entender padrões em território desconhecido—algo com o qual a IA historicamente lutou.
De acordo com Chollet, o o3 está “fazendo algo fundamentalmente diferente” do que seus predecessores. (Embora o o3 ainda erre alguns quebra-cabeças que os humanos resolvem facilmente. E já há uma versão mais difícil do ARC-AGI em andamento para desafiá-lo ainda mais.)
Então, isso significa que estamos à beira da AGI? Provavelmente ainda não. Chollet mesmo diz que superar os humanos neste teste não equivale magicamente à AGI.
Mas o desempenho do o3 sugere que a IA está fazendo progressos mais significativos em capacidades uma vez consideradas puramente humanas.
Mas Pode Fazer Seu Trabalho?
Pode não importar se o o3 é um precursor da AGI, diz Roetzer. O que importa é como suas capacidades muito reais impactam seu trabalho diário.
“Essas avaliações são legais de se discutir, mas a coisa que realmente importa para todos nós é—esses modelos são super-humanos nas tarefas que fazemos todos os dias?,” ele diz. Essa é a pergunta a ser respondida para determinar como os modelos de raciocínio realmente afetarão seu trabalho.
Em outras palavras, é uma coisa o o3 dominar um quebra-cabeça de raciocínio em um laboratório. É outra coisa completamente diferente lidar com suas tarefas específicas, em seu setor específico, com suas limitações específicas. E nenhum grande laboratório de IA está realizando testes oficiais sobre como o o3 pode lidar, digamos, com merchandising de produtos no varejo, ou revisão de conformidade na saúde.
A medida que 2025 (e além) se desenrola, no entanto, é quase certo que esses modelos se tornarão “super-humanos” em mais e mais tarefas—e isso não é apenas conversa. As pessoas já estão vendo vislumbres de raciocínio avançado no o1, que muitos estão usando intensivamente apesar de uma taxa alta de $200/mês.
De acordo com Sam Altman, a OpenAI inicialmente fixou esse preço do o1 pensando que seria lucrativo porque o uso seria limitado. Em vez disso, o modelo tem sido utilizado de tal forma que está custando dinheiro à OpenAI no ponto de preço atual—sugerindo que essas ferramentas têm um valor sério e tangível para usuários intensivos.
Quando o o3 finalmente se tornar disponível—e nenhuma data foi oficialmente definida—ele pode lidar com planejamento estratégico, fluxos de trabalho criativos, e outras tarefas complexas de maneira mais eficiente (ou mais expert) do que muitos profissionais.
Essa é a questão que você precisa ficar atento.
O Que Acontece a Seguir
A OpenAI não compartilhou um cronograma exato de lançamento para o o3. Por enquanto, temos apenas seu desempenho em um punhado de benchmarks difíceis para considerar. E esse desempenho é impressionante.
Mas, como Roetzer aponta, a verdadeira questão é se o o3 (e os modelos subsequentes) se tornam super-humanos nas tarefas de trabalho que compõem a espinha dorsal da economia.
“As avaliações que são usadas para testar isso não são necessariamente representativas do impacto na economia e na força de trabalho,” ele diz. “Estão tentando criar coisas extremamente complicadas que apenas as mentes mais brilhantes do mundo podem resolver.”
Mas se um sistema de IA pode lidar com 25-30 tarefas que você realiza diariamente e fazê-las significativamente mais rápido e melhor, é aí que veremos um impacto real.
“Vamos começar a ver um monte dessas tarefas onde esses modelos podem fazer melhor que você,” diz Roetzer. “E você encontrará outras coisas para fazer.”
Afinal, para muitos profissionais, não faltam atividades de maior valor para se concentrar se a IA puder cuidar das partes tediosas ou que consomem muito tempo.
Mas uma coisa é certa: Com o o3 superando humanos em um importante benchmark de raciocínio, estamos testemunhando mais um salto nas capacidades da IA. Seja isso o primeiro passo em direção à IA em nível humano ou apenas um marco incremental, é um sinal claro:
Esses modelos estão se tornando mais poderosos a cada dia—e em breve poderão ser os melhores “pensadores” na sala.
Conteúdo relacionado
Google Workspace Adquire 50 Anúncios Diferentes em sua Estreia no Super Bowl
[the_ad id="145565"] Como a recente reação negativa mostrou, as marcas que utilizam inteligência artificial em suas campanhas publicitárias enfrentam um caminho difícil para…
CEO da Meta, Mark Zuckerberg, Elogia Trump na Chamada do Q4, Enquanto Receita Dispara
[the_ad id="145565"] Os números R$ 164,5 bilhões — Receita da Meta em 2024, aumentando 22% em comparação a 2023. A receita do Q4 foi de R$ 48,39 bilhões, com um aumento de 21%…
Perspectivas de Liderança e Crescimento com Michael Kassan da 3C Ventures
[the_ad id="145565"] Bem-vindo a este episódio do podcast Marketing Vanguard. Hoje, Jenny Rooney conversa com Michael Kassan, fundador e CEO da 3C Ventures. Nesta conversa,…