Bolt42

Em resposta à pressão de rivais, incluindo a empresa chinesa de IA DeepSeek, a OpenAI está alterando a maneira como seu mais novo modelo de IA, o3-mini, comunica seu processo de “pensamento” passo a passo.

Nesta quinta-feira, a OpenAI anunciou que usuários gratuitos e pagos do ChatGPT, a plataforma de chatbot alimentada por IA da empresa, verão uma atualização na “cadeia de pensamento”, que mostrará mais etapas do “raciocínio” do modelo e como ele chegou às respostas às perguntas. Assinantes dos planos premium do ChatGPT que utilizam o o3-mini na configuração “alto raciocínio” também verão essa atualização, de acordo com a OpenAI.

“Estamos introduzindo uma atualização da [cadeia de pensamento] para o o3-mini, projetada para facilitar a compreensão de como o modelo pensa”, disse um porta-voz da OpenAI ao TechCrunch por e-mail. “Com essa atualização, você poderá acompanhar o raciocínio do modelo, proporcionando mais clareza e confiança em suas respostas.”

OpenAI o3-mini CoT
Créditos da Imagem:OpenAI

Modelos de raciocínio como o o3-mini verificam minuciosamente suas informações antes de oferecer resultados, ajudando a evitar algumas armadilhas que normalmente prejudicam os modelos. A desvantagem é que esses modelos de raciocínio demoram um pouco mais para chegar a soluções — geralmente de segundos a minutos a mais.

O modelo R1 da DeepSeek, um modelo de “raciocínio” semelhante ao o3-mini, revela todo o seu processo de pensamento, que muitos pesquisadores de IA argumentam ser a abordagem preferida. Além de tornar o modelo mais fácil de estudar, os passos de raciocínio proporcionam uma melhor experiência ao usuário em certas situações, indicando quando o modelo pode estar no caminho certo — ou errado.

A OpenAI optou por não mostrar as etapas completas de raciocínio para o o3-mini e seus predecessores, o o1 e o o1-mini, em parte devido a razões competitivas. Em vez disso, os usuários viam apenas resumos das etapas de raciocínio — resumos que às vezes eram errôneos.

A OpenAI ainda não está mostrando as etapas completas de raciocínio do o3-mini, mas a empresa afirma que “encontrou um equilíbrio”: o o3-mini pode “pensar livremente” e, em seguida, organizar seus “pensamentos” em resumos mais detalhados.

“Para melhorar a clareza e a segurança, adicionamos uma etapa de pós-processamento adicional onde o modelo revisa a cadeia de pensamento bruta, removendo qualquer conteúdo inseguro e, em seguida, simplificando quaisquer ideias complexas”, continuou o porta-voz da OpenAI. “Além disso, essa etapa de pós-processamento permite que usuários não falantes de inglês recebam a cadeia de pensamento em seu idioma nativo, criando uma experiência mais acessível e amigável.”

Em um AMA no Reddit na semana passada, Kevin Weil, diretor de produtos da OpenAI, sugeriu que a mudança estava a caminho.

“Estamos trabalhando para mostrar muito mais do que mostramos hoje — [mostrar o processo de pensamento do modelo] será muito, muito em breve”, disse ele. “Ainda estamos a determinar tudo — mostrar toda a cadeia de pensamento leva à destilação competitiva, mas também sabemos que as pessoas (pelo menos os usuários avançados) querem isso, então vamos encontrar a maneira certa de equilibrar.”

TechCrunch tem um boletim focado em IA! Inscreva-se aqui para recebê-lo em sua caixa de entrada toda quarta-feira.


    cinco − 4 =

    Bolt42