Bolt42

Estão surgindo rumores sobre o novo sistema de IA da OpenAI, codinome “Strawberry”, e podemos vê-lo já neste outono, de acordo com o The Information.

O Que Saber Sobre Strawberry

Segundo relatórios recentes do The Information, a OpenAI está apressada para lançar um novo sistema de IA que pode representar um grande avanço nas habilidades de resolução de problemas, especialmente em matemática e programação.

Esse sistema, conhecido como “Strawberry”, pode ser integrado a um chatbot—possivelmente até mesmo ao ChatGPT—já neste outono.

Mas o que torna o Strawberry tão especial? Vamos detalhar:

  1. Mestrado em Matemática: O Strawberry pode resolver problemas matemáticos que nunca viu antes, superando as capacidades das ferramentas de IA atuais.
  2. Tempo de Reflexão: Quando lhe é dado tempo adicional para ponderar sobre os problemas, o Strawberry pode realizar tarefas mais subjetivas de forma mais eficaz, como responder a perguntas sobre estratégias de marketing de produtos.
  3. Gerador de Dados: Uma versão maior do Strawberry está sendo utilizada para gerar dados de treinamento sintéticos para o próximo modelo principal da OpenAI, codinome Orion.

Por Que Strawberry é Importante

O Strawberry não é apenas mais uma melhoria incremental na IA—ele representa um passo significativo em direção ao que a OpenAI chama de IA “Nível 2”: raciocinadores com habilidades de resolução de problemas em nível humano.

“Esse é um passo em direção à inteligência artificial geral (AGI) que a OpenAI busca”, me contou Paul Roetzer, fundador e CEO do Marketing AI Institute, durante o Episódio 113 do The Artificial Intelligence Show.

Mas a verdadeira mudança de jogo aqui é como o Strawberry alcança suas impressionantes capacidades. Tudo se resume a um conceito chamado “supervisão de processos”.

A Receita Secreta: Supervisão de Processos

Em maio de 2023, pesquisadores da OpenAI publicaram um artigo intitulado Vamos Verificar Passo a Passo.

“Acho que este artigo é provavelmente o modelo para o Strawberry”, diz Roetzer.

Aqui está a ideia principal: em vez de apenas recompensar a IA por chegar à resposta final correta (supervisão de resultados), o Strawberry é recompensado por cada passo correto em seu processo de raciocínio (supervisão de processos). É como dar uma estrela de ouro à IA não apenas por passar no teste, mas por mostrar seu trabalho em cada etapa do caminho.

Por que isso é tão importante? Permite que a IA:

  • Se autoavalie a cada passo
  • Identifique e corrija erros ao longo do caminho
  • Reduza drasticamente alucinações e erros
  • Melhore potencialmente ao longo do tempo

“Uma vez que esses modelos consigam fazer isso, uma vez que consigam eliminar as taxas de erro ou reduzi-las drasticamente, conseguem eliminar as alucinações e se recompensar ao longo do caminho,” diz Roetzer. “Agora eles desenvolvem a capacidade de se aprimorar.”

A IA “auto-corrigível” nos coloca em uma situação onde as capacidades da IA podem ascender rapidamente, afirma Roetzer.

O Caminho à Frente

Embora o potencial do Strawberry seja empolgante, é importante observar que o que provavelmente veremos publicamente é uma versão reduzida e “mais segura” do modelo completo, diz Roetzer. (A OpenAI tem um histórico de lançar versões mais limitadas de suas tecnologias ao público.)

Independentemente disso, espere que o Strawberry marque um marco significativo no desenvolvimento da IA se fizer o que estamos especulando que faça. Ao melhorar a capacidade da IA de raciocinar, planejar e auto-corrigir, estamos dando um grande passo em direção a sistemas de IA mais confiáveis e capazes. Embora não possamos ver imediatamente todo o poder do Strawberry, seu desenvolvimento sinaliza uma nova era nas capacidades de resolução de problemas da IA.




Bolt42