As pessoas realmente pagarão $200 por mês pelo novo chatbot da OpenAI?

Na quinta-feira, a OpenAI lançou o que é, efetivamente, um chatbot de $200 por mês — e a comunidade de IA não sabia bem o que pensar sobre isso.

O novo plano ChatGPT Pro da empresa oferece acesso ao “modo o1 pro”, que a OpenAI diz que “usa mais recursos computacionais para as melhores respostas às perguntas mais difíceis”. Uma versão aprimorada do modelo de raciocínio o1 da OpenAI, o modo o1 pro deve responder a perguntas relacionadas à ciência, matemática e codificação de forma mais “confiável” e “abrangente”, segundo a OpenAI.

Quase imediatamente, as pessoas começaram a pedi-lo para desenhar unicórnios:

Eu pedi ao ChatGPT o modo Pro para criar um SVG de um unicórnio.

(Este é o modelo que você tem acesso por $200 mensais) pic.twitter.com/h9HwY3aYwU

— Rammy (@rammydev) 5 de dezembro de 2024

E projetar um computador “baseado em caranguejo”:

Finalmente colocando o o1-pro em seu uso mais extremo. pic.twitter.com/nX4JAjx71m

— Ethan Mollick (@emollick) 6 de dezembro de 2024

E discorrer poeticamente sobre o significado da vida:

Acabei de me inscrever na assinatura de $200/mês da OpenAI.
Responda com perguntas para perguntar e eu as repostarei neste thread. pic.twitter.com/oTQxbPxnoP

— Garrett Scott 🕳 (@thegarrettscott) 5 de dezembro de 2024

Mas muitas pessoas no X não pareciam convencidas de que as respostas do modo o1 pro eram realmente dignas de $200.

“A OpenAI compartilhou exemplos concretos de prompts que falham no o1 regular mas têm sucesso no o1-pro?” perguntou o cientista da computação britânico Simon Willison. “Quero ver um único exemplo concreto que mostre sua vantagem.”

É uma pergunta razoável; afinal, esta é a assinatura de chatbot mais cara do mundo. O serviço vem com outros benefícios, como a remoção de limites de taxa e acesso ilimitado aos outros modelos da OpenAI. Mas $2.400 por ano não é uma quantia pequena, e a proposta de valor do modo o1 pro, em particular, continua obscura.

Não demorou muito para encontrar casos de falha. O modo o1 pro tem dificuldades com Sudoku, e se confundiu com uma piada de ilusão óptica que é óbvia para qualquer humano.

o1 e o1-pro falharam aqui, provavelmente ainda por causa das limitações visuais (o mesmo com os quebra-cabeças de Sudoku) https://t.co/mAVK7WxBrq pic.twitter.com/O9boSv7ZGt

— Tibor Blaho (@btibor91) 5 de dezembro de 2024

Os benchmarks internos da OpenAI mostram que o modo o1 pro apresenta apenas uma leve melhora em relação ao o1 padrão em problemas de codificação e matemática:

OpenAI o1-pro-mode — **Créditos da Imagem:**OpenAI

A OpenAI fez uma avaliação “mais rigorosa” nos mesmos benchmarks para mostrar a consistência do modo o1 pro: o modelo foi considerado que resolveu uma pergunta se acertou a resposta quatro de quatro vezes. Mas mesmo nesses testes, as melhorias não eram dramáticas:

O CEO da OpenAI, Sam Altman, que uma vez escreveu que a OpenAI estava em um caminho “para uma inteligência tão barata que não precisa ser medida”, foi forçado a esclarecer várias vezes na quinta-feira que o ChatGPT Pro não é para a maioria das pessoas.

“A maioria dos usuários ficará muito feliz com o o1 na [camada ChatGPT] Plus!” disse ele no X. “Quase todos serão melhor atendidos pela nossa camada gratuita ou pela camada Plus.”

Então, para quem é? Existem realmente pessoas dispostas a pagar $200 por mês para fazer perguntas como “Escreva um ensaio de 3 parágrafos sobre morangos sem usar a letra ‘e’” ou “resolva este problema da Olimpíada de Matemática“? Elas estarão dispostas a abrir mão de seu dinheiro suado sem muita garantia de que o o1 padrão não consegue responder satisfatoriamente às mesmas questões?

Perguntei a Ameet Talwalkar, professor associado de aprendizado de máquina na Carnegie Mellon e parceiro de risco na Amplify Partners, sua opinião. “Parece um grande risco para mim aumentar o preço dez vezes,” ele disse ao TechCrunch por e-mail. “Acho que teremos uma noção muito melhor em algumas semanas quanto ao apetite por esta funcionalidade.”

O cientista da computação da UCLA, Guy Van den Broeck, foi mais sincero em sua avaliação. “Não sei se o preço faz sentido,” ele disse ao TechCrunch, “e se modelos de raciocínio caros serão a norma.”

o1 é “melhor do que a maioria dos humanos na maioria das tarefas” porque, sim, os humanos existem exclusivamente em interfaces de chat multi-turno amnésicas e desincorporadas https://t.co/zbLY2BG5pQ

— Aidan McLau (@aidan_mclau) 6 de dezembro de 2024

Uma visão generosa é que isso é um erro de marketing. Descrever o modo o1 pro como o melhor em resolver “os problemas mais difíceis” não diz muito aos clientes em potencial. Tampouco afirmativas vagas sobre como o modelo pode “pensar mais” e demonstrar “inteligência”. Como Willison aponta, sem exemplos específicos dessa suposta capacidade melhorada, é difícil justificar o pagamento de mais, ainda mais dez vezes o preço.

isso é um prompt tão engraçado recomendado para um modelo de ia que custa $2400/ano

Espero que a openai mantenha esses prompts padrões até a asi pic.twitter.com/JQ5vLKxWWR

— Dean W. Ball (@deanwball) 6 de dezembro de 2024

Pelo que posso perceber, especialistas em campos especializados são o público-alvo pretendido. A OpenAI diz que planeja conceder a alguns pesquisadores médicos de “instituições de destaque” acesso gratuito ao ChatGPT Pro, que incluirá o modo o1 pro. Erros são muito importantes na área da saúde e, como Bob McGrew, ex-diretor de pesquisa da OpenAI, notou no X, uma melhor confiabilidade é talvez a principal vantagem do modo o1 pro.

Estive brincando com o o1 e o1-pro um pouco.

Eles são muito bons & um pouco estranhos. Eles também não são para a maioria das pessoas na maioria das vezes. Você realmente precisa ter problemas particularmente difíceis para resolver para obter valor disso. Mas se você tiver esses problemas, isso é um grande negócio.

— Ethan Mollick (@emollick) 5 de dezembro de 2024

McGrew também ponderou que o modo o1 pro é um exemplo do que ele chama de “sobreposição de inteligência”: usuários (e talvez os criadores do modelo) não saberem como obter valor de qualquer “inteligência extra” devido a limites fundamentais de uma interface simples e baseada em texto. Assim como com os outros modelos da OpenAI, a única maneira de interagir com o modo o1 pro é através do ChatGPT, e — como apontou McGrew — o ChatGPT não é perfeito.

É verdade também que $200 cria expectativas altas. E, pelo que indica a recepção inicial nas redes sociais, o ChatGPT Pro não é uma certeza absoluta de sucesso.

Conteúdo relacionado

BusinessInteligência artificial

OpenAI está supostamente em negociações para comprar a Windsurf por $3 bilhões, com novidades esperadas para esta semana.

[the_ad id="145565"] A Windsurf, fabricante de um popular assistente de codificação por IA, está em negociações para ser adquirida pela OpenAI por cerca de $3 bilhões, segundo…

BusinessInteligência artificial

A OpenAI procurou o criador do Cursor antes de iniciar negociações para comprar a Windsurf por $3 bilhões.

[the_ad id="145565"] Quando a notícia de que a OpenAI estava em negociações para adquirir a empresa de codificação AI Windsurf por $3 bilhões surgiu, uma das primeiras…

Inteligência artificial

Como a IA está redesenhando os mapas de eletricidade do mundo: Insights do Relatório da AIE

[the_ad id="145565"] A inteligência artificial (IA) não está apenas transformando a tecnologia; ela também está mudando de forma significativa o setor energético global. De…