Bolt42

A OpenAI está atualizando o modelo de IA que alimenta o Operator, seu agente de IA que pode navegar autonomamente na web e usar certos softwares dentro de uma máquina virtual hospedada na nuvem para atender às solicitações dos usuários.

Em breve, o Operator usará um modelo baseado no o3, um dos mais recentes da série de modelos de raciocínio da OpenAI. Anteriormente, o Operator dependia de uma versão personalizada do GPT-4o.

Por muitas métricas, o o3 é um modelo muito mais avançado, especialmente em tarefas que envolvem matemática e raciocínio.

“Estamos substituindo o modelo baseado no GPT‑4o existente para o Operator por uma versão baseada no OpenAI o3,” escreveu a OpenAI em um publicação de blog. “A versão API [do Operator] continuará baseada no 4o.”

O Operator é um entre muitas ferramentas agentes lançadas por empresas de IA nos últimos meses. As empresas estão competindo para criar agentes altamente sofisticados que podem realizar tarefas de forma quase autônoma.

O Google oferece um agente de “uso de computador” através de sua API Gemini, que pode navegar na web e realizar ações em nome dos usuários, além de uma oferta mais voltada para o consumidor chamada Mariner. Os modelos da Anthropic também são capazes de realizar tarefas de computador, incluindo abrir arquivos e navegar em páginas da web.

De acordo com a OpenAI, o novo modelo do Operator, chamado o3 Operator, foi “ajustado com dados adicionais de segurança para uso de computador,” incluindo conjuntos de dados projetados para “ensinar ao modelo os limites de decisão da OpenAI sobre confirmações e recusa.”

A OpenAI lançou um relatório técnico mostrando o desempenho do o3 Operator em avaliações de segurança específicas. Comparado ao modelo do Operator GPT-4o, o o3 Operator é menos propenso a recusar realizar atividades “ilícitas” e a buscar dados pessoais sensíveis, além de ser menos suscetível a uma forma de ataque de IA conhecida como injeção de prompt, de acordo com o relatório técnico.

“O o3 Operator utiliza a mesma abordagem de segurança em múltiplas camadas que usamos para a versão 4o do Operator,” escreveu a OpenAI em sua publicação de blog. “Embora o o3 Operator herde as capacidades de codificação do o3, ele não tem acesso nativo a um ambiente de codificação ou terminal.”


    5 × um =

    Bolt42