Bolt42

Participe de nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de ponta. Saiba Mais


Foi uma semana significativa para anúncios de IA após eventos da Microsoft, Google e Anthropic. No entanto, a OpenAI está encerrando a semana com suas próprias novidades. E não estamos apenas falando sobre a aquisição de $6,5 bilhões da equipe de design de Jony Ive para liderar um novo esforço de hardware, “io” na OpenAI.

Hoje, a empresa atualizou seu Operador, um agente autônomo de navegação na web e controle de cursor dentro do ChatGPT, de usar o anterior modelo de linguagem multimodal GPT-4o para o novo e mais poderoso modelo de raciocínio o3.

A atualização, lançada globalmente hoje, 23 de maio de 2025, está disponível como uma “prévia de pesquisa” para assinantes da versão Premium do ChatGPT da OpenAI, que custa $200 USD por mês.

Basicamente, essa é a maneira da OpenAI de dizer que ainda não é um produto totalmente “lapidado” ou aperfeiçoado — pode ainda apresentar falhas e problemas.

Mas com o rival Google oferecendo seu próprio pacote de assinatura de IA de nível superior a um preço de quase $250 USD por mês (atualmente com desconto para $125 nos primeiros três meses) para acessar seus últimos modelos multimodais Gemini, geração de imagens Imagen e geração de vídeos Veo, de repente o plano ChatGPT Pro da OpenAI parece mais acessível em comparação.

O que é o Operador da OpenAI e para que serve?

O Operador foi lançado pela primeira vez em janeiro de 2025 como o primeiro passo da OpenAI em agentes semi-autônomos, especificamente Agentes Usando Computador (CUAs). A ideia é ir além da interface de chatbot do ChatGPT e permitir que os poderosos modelos de IA da OpenAI comecem a tomar mais ações em nome do usuário.

Dessa forma, o Operador foi projetado para apontar, clicar, rolar e digitar autonomamente para completar tarefas baseadas na web, como reservar jantares, compilar listas de compras ou encomendar ingressos para eventos. Essa capacidade agente permite que ele complete tarefas do usuário diretamente através de uma interface de navegador.

Por motivos de segurança, privacidade e proteção, o Operador não usou nenhum navegador existente no PC ou Mac do usuário. Em vez disso, operou em um navegador virtual hospedado na nuvem, acessível via um site autônomo—operator.chatgpt.com—onde os usuários podiam inserir pedidos e observar o agente realizar tarefas em tempo real.

Ele combinou visão, raciocínio e capacidades de interação baseadas no GPT-4o, marcando uma nova direção para a OpenAI em IA agente.

O produto foi lançado como uma prévia de pesquisa para assinantes do ChatGPT Pro e apresentava medidas de segurança integradas, como confirmações do usuário, Modo de Observação e restrições em plataformas web de alto risco.

Ele também estava sendo testado em contextos empresariais, incluindo planejamento de viagens e serviços cívicos, demonstrando seu potencial em ambientes tanto de consumo quanto de negócios.

o3 oferece melhor precisão, estrutura e taxas de sucesso

Com esta atualização, a OpenAI visa melhorar o desempenho em várias dimensões importantes. O novo Operador baseado em o3 demonstra melhor persistência e precisão durante as interações no navegador.

Em termos práticos, isso significa que é mais provável que ele complete tarefas do usuário com sucesso e com menos necessidade de correções ou repetições. Além disso, os usuários podem esperar respostas mais claras, estruturadas e abrangentes.

Em avaliações comparativas, o novo modelo mostra uma vantagem distinta em relação ao seu predecessor. Estudos de preferência humana revelam que os usuários favorecem o modelo o3 por seu estilo, abrangência e clareza. Ele também se destaca em seguir instruções e eficiência, embora os resultados para correção factual sejam mais equilibrados entre as versões.

O desempenho em benchmarks de avaliação de terceiros reflete essas melhorias. No benchmark OSWorld, que mede a conclusão de tarefas baseadas em navegador, o modelo o3 marcou 42,9 em comparação a 38,1 para a versão anterior.

No WebArena, o novo modelo alcançou uma pontuação de 62,9, acima dos 48,1. A melhoria mais dramática parece aparecer no benchmark GAIA, onde o modelo o3 marcou 62,2, superando em muito os 12,3 do modelo anterior.

Comparações lado a lado de tarefas ilustram ainda mais esses ganhos. Em um exemplo envolvendo um pedido de reserva em restaurante, o novo modelo forneceu uma lista mais clara e detalhada de reservas disponíveis, incluindo localizações, classificações Michelin e notas de assentos, apresentadas em uma tabela bem formatada. A versão anterior, embora funcional, entregou menos informações de maneira menos organizada, de acordo com uma imagem incluída com as notas de lançamento do novo Operador o3:

As salvaguardas permanecem, assim como notas gerais de cautela sobre o uso em transações financeiras sensíveis e acesso a contas

O modelo o3 também herda as medidas de segurança introduzidas com versões anteriores, com melhorias adicionais para seu papel como sistema agente.

A OpenAI integrou um treinamento aprimorado contra a execução de tarefas prejudiciais, vulnerabilidades de injeção de prompt e erros relacionados à intenção do usuário.

Avaliações mostram que o modelo agora confirma 94% das ações sensíveis antes de executá-las, com 100% de confirmação em transações financeiras. A suscetibilidade à injeção de prompt também diminuiu de 23% para 20%.

Notavelmente, o Operador o3 mantém uma linha cautelosa em relação a certas interações web de alto risco, como plataformas de e-mail ou financeiras, onde pode exigir supervisão do usuário via Modo de Observação ou se recusar explicitamente a prosseguir. Essas medidas fazem parte de uma abordagem em camadas para segurança, que combina robustez no nível do modelo com monitoramento em tempo real.

Embora a atualização para o Operador marque uma melhoria técnica, ela também reflete o compromisso contínuo da OpenAI com a implantação responsável de IA.

A capacidade do sistema de realizar ações no mundo real introduz novos riscos, e a equipe de desenvolvimento continuará a aprimorar seus protocolos de segurança conforme necessário.

De acordo com a documentação atualizada do cartão de sistema o3 da OpenAI, o modelo permanece abaixo dos limites de capacidade de alto risco em categorias como abuso biológico e químico, e não possui ambiente de programação nativo ou acesso a terminais, reduzindo ainda mais potenciais vetores de uso indevido.

O Operador continua sendo uma prévia de pesquisa e está acessível apenas para usuários do ChatGPT Pro. A versão API de respostas do Operador continuará sendo baseada no modelo GPT-4o, pelo menos por enquanto.

Implicações para decisores técnicos empresariais

O Operador atualizado deve melhorar significativamente os fluxos de trabalho de profissionais em engenharia de IA, orquestração, gestão de dados e segurança da informação.

Para aqueles que constroem ou mantêm modelos de aprendizado de máquina, a precisão aprimorada e as saídas estruturadas do modelo reduzem a carga de validação de testes e resolução de problemas.

Em contextos de orquestração, oferece uma ferramenta prática e confiável para automatizar componentes baseados na web de pipelines complexos.

Engenheiros de dados podem delegar interações manuais na web — como verificação e coleta de dados — com mais confiança, liberando tempo para trabalhos de otimização de nível superior.

Os profissionais de segurança, por sua vez, ganham uma maneira mais segura de simular o comportamento do usuário em auditorias e exercícios de resposta a incidentes, graças às camadas de segurança do modelo.

Em todas essas disciplinas, o Operador baseado em o3 introduz tanto uma atualização de capacidade quanto uma estrutura de mitigação de riscos, tornando-se uma adição prática ao kit de ferramentas técnicas contemporâneo.





    12 + 19 =




    Bolt42