Na quinta-feira, a OpenAI lançou o que é, efetivamente, um chatbot de $200 por mês — e a comunidade de IA não sabia bem o que pensar sobre isso.
O novo plano ChatGPT Pro da empresa oferece acesso ao “modo o1 pro”, que a OpenAI diz que “usa mais recursos computacionais para as melhores respostas às perguntas mais difíceis”. Uma versão aprimorada do modelo de raciocínio o1 da OpenAI, o modo o1 pro deve responder a perguntas relacionadas à ciência, matemática e codificação de forma mais “confiável” e “abrangente”, segundo a OpenAI.
Quase imediatamente, as pessoas começaram a pedi-lo para desenhar unicórnios:
Eu pedi ao ChatGPT o modo Pro para criar um SVG de um unicórnio.
(Este é o modelo que você tem acesso por $200 mensais) pic.twitter.com/h9HwY3aYwU
— Rammy (@rammydev) 5 de dezembro de 2024
E projetar um computador “baseado em caranguejo”:
Finalmente colocando o o1-pro em seu uso mais extremo. pic.twitter.com/nX4JAjx71m
— Ethan Mollick (@emollick) 6 de dezembro de 2024
E discorrer poeticamente sobre o significado da vida:
Acabei de me inscrever na assinatura de $200/mês da OpenAI.
Responda com perguntas para perguntar e eu as repostarei neste thread. pic.twitter.com/oTQxbPxnoP— Garrett Scott 🕳 (@thegarrettscott) 5 de dezembro de 2024
Mas muitas pessoas no X não pareciam convencidas de que as respostas do modo o1 pro eram realmente dignas de $200.
“A OpenAI compartilhou exemplos concretos de prompts que falham no o1 regular mas têm sucesso no o1-pro?” perguntou o cientista da computação britânico Simon Willison. “Quero ver um único exemplo concreto que mostre sua vantagem.”
É uma pergunta razoável; afinal, esta é a assinatura de chatbot mais cara do mundo. O serviço vem com outros benefícios, como a remoção de limites de taxa e acesso ilimitado aos outros modelos da OpenAI. Mas $2.400 por ano não é uma quantia pequena, e a proposta de valor do modo o1 pro, em particular, continua obscura.
Não demorou muito para encontrar casos de falha. O modo o1 pro tem dificuldades com Sudoku, e se confundiu com uma piada de ilusão óptica que é óbvia para qualquer humano.
o1 e o1-pro falharam aqui, provavelmente ainda por causa das limitações visuais (o mesmo com os quebra-cabeças de Sudoku) https://t.co/mAVK7WxBrq pic.twitter.com/O9boSv7ZGt
— Tibor Blaho (@btibor91) 5 de dezembro de 2024
Os benchmarks internos da OpenAI mostram que o modo o1 pro apresenta apenas uma leve melhora em relação ao o1 padrão em problemas de codificação e matemática:
A OpenAI fez uma avaliação “mais rigorosa” nos mesmos benchmarks para mostrar a consistência do modo o1 pro: o modelo foi considerado que resolveu uma pergunta se acertou a resposta quatro de quatro vezes. Mas mesmo nesses testes, as melhorias não eram dramáticas:
O CEO da OpenAI, Sam Altman, que uma vez escreveu que a OpenAI estava em um caminho “para uma inteligência tão barata que não precisa ser medida”, foi forçado a esclarecer várias vezes na quinta-feira que o ChatGPT Pro não é para a maioria das pessoas.
“A maioria dos usuários ficará muito feliz com o o1 na [camada ChatGPT] Plus!” disse ele no X. “Quase todos serão melhor atendidos pela nossa camada gratuita ou pela camada Plus.”
Então, para quem é? Existem realmente pessoas dispostas a pagar $200 por mês para fazer perguntas como “Escreva um ensaio de 3 parágrafos sobre morangos sem usar a letra ‘e’” ou “resolva este problema da Olimpíada de Matemática“? Elas estarão dispostas a abrir mão de seu dinheiro suado sem muita garantia de que o o1 padrão não consegue responder satisfatoriamente às mesmas questões?
Perguntei a Ameet Talwalkar, professor associado de aprendizado de máquina na Carnegie Mellon e parceiro de risco na Amplify Partners, sua opinião. “Parece um grande risco para mim aumentar o preço dez vezes,” ele disse ao TechCrunch por e-mail. “Acho que teremos uma noção muito melhor em algumas semanas quanto ao apetite por esta funcionalidade.”
O cientista da computação da UCLA, Guy Van den Broeck, foi mais sincero em sua avaliação. “Não sei se o preço faz sentido,” ele disse ao TechCrunch, “e se modelos de raciocínio caros serão a norma.”
o1 é “melhor do que a maioria dos humanos na maioria das tarefas” porque, sim, os humanos existem exclusivamente em interfaces de chat multi-turno amnésicas e desincorporadas https://t.co/zbLY2BG5pQ
— Aidan McLau (@aidan_mclau) 6 de dezembro de 2024
Uma visão generosa é que isso é um erro de marketing. Descrever o modo o1 pro como o melhor em resolver “os problemas mais difíceis” não diz muito aos clientes em potencial. Tampouco afirmativas vagas sobre como o modelo pode “pensar mais” e demonstrar “inteligência”. Como Willison aponta, sem exemplos específicos dessa suposta capacidade melhorada, é difícil justificar o pagamento de mais, ainda mais dez vezes o preço.
isso é um prompt tão engraçado recomendado para um modelo de ia que custa $2400/ano
Espero que a openai mantenha esses prompts padrões até a asi pic.twitter.com/JQ5vLKxWWR
— Dean W. Ball (@deanwball) 6 de dezembro de 2024
Pelo que posso perceber, especialistas em campos especializados são o público-alvo pretendido. A OpenAI diz que planeja conceder a alguns pesquisadores médicos de “instituições de destaque” acesso gratuito ao ChatGPT Pro, que incluirá o modo o1 pro. Erros são muito importantes na área da saúde e, como Bob McGrew, ex-diretor de pesquisa da OpenAI, notou no X, uma melhor confiabilidade é talvez a principal vantagem do modo o1 pro.
Estive brincando com o o1 e o1-pro um pouco.
Eles são muito bons & um pouco estranhos. Eles também não são para a maioria das pessoas na maioria das vezes. Você realmente precisa ter problemas particularmente difíceis para resolver para obter valor disso. Mas se você tiver esses problemas, isso é um grande negócio.
— Ethan Mollick (@emollick) 5 de dezembro de 2024
McGrew também ponderou que o modo o1 pro é um exemplo do que ele chama de “sobreposição de inteligência”: usuários (e talvez os criadores do modelo) não saberem como obter valor de qualquer “inteligência extra” devido a limites fundamentais de uma interface simples e baseada em texto. Assim como com os outros modelos da OpenAI, a única maneira de interagir com o modo o1 pro é através do ChatGPT, e — como apontou McGrew — o ChatGPT não é perfeito.
É verdade também que $200 cria expectativas altas. E, pelo que indica a recepção inicial nas redes sociais, o ChatGPT Pro não é uma certeza absoluta de sucesso.
Conteúdo relacionado
Ex-líderes do Google e Meta lançam a Palona AI, trazendo agentes de atendimento personalizados e emocionais para empresas não tecnológicas
[the_ad id="145565"] Participe das nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de liderança no setor. Saiba…
A Índia elogia o laboratório de IA chinês DeepSeek e planeja hospedar seus modelos em servidores locais.
[the_ad id="145565"] O ministro de TI da Índia elogiou, na quinta-feira, o progresso da DeepSeek e afirmou que o país hospedará os modelos de linguagem de grande porte do…
SuperOps conquista R$ 125 milhões para usar IA e ajudar melhor provedores de serviços gerenciados
[the_ad id="145565"] SuperOps, uma startup indiana que oferece ferramentas para ajudar provedores de serviços de TI e administradores de sistemas internos em empresas, levantou…