A OpenAI me deu uma semana para testar seu novo agente de IA, o Operator, um sistema que pode realizar tarefas de forma independente na internet.
O Operator é a coisa mais próxima que vi da visão da indústria de tecnologia sobre agentes de IA — sistemas que podem automatizar as partes entediantes da vida, nos liberando para fazer as coisas que realmente amamos. No entanto, com base na minha experiência com o agente da OpenAI, sistemas de IA verdadeiramente “autônomos” ainda estão um pouco além do alcance.
A OpenAI treinou um novo modelo para alimentar o Operator, que combina a compreensão visual do GPT-4o com as capacidades de raciocínio do o1.
Esse modelo parece funcionar bem para tarefas básicas; eu vi o Operator clicar em botões, navegar por menus em websites e preencher formulários. A IA foi ocasionalmente bem-sucedida em tomar ações de forma independente e funciona muito mais rapidamente do que agentes baseados na web que vi da Anthropic e do Google.
Mas durante meu teste, me vi ajudando o agente da OpenAI mais do que gostaria. Parecia que eu estava orientando o Operator em cada problema, enquanto queria que certas tarefas fossem realizadas sem a minha intervenção.
Com muita frequência durante meu teste, tive que responder a várias perguntas, conceder permissões, preencher informações pessoais e ajudar o agente quando ele ficou preso.
Em termos automobilísticos, o Operator é como dirigir um carro com controle de cruzeiro – ocasionalmente tirando o pé do acelerador e deixando o carro dirigir por conta própria – mas está longe de ser um piloto automático completo.
Na verdade, a OpenAI diz que as pausas frequentes do Operator são intencionais.
A IA que alimenta o Operator, assim como a IA que alimenta chatbots como o ChatGPT da OpenAI, não consegue trabalhar de forma independente por longos períodos e é propensa ao mesmo tipo de alucinações. Por causa disso, a OpenAI não quer dar ao sistema muito poder de decisão ou informações sensíveis do usuário. Talvez essa seja uma escolha segura da OpenAI, mas reduz a praticidade do Operator.
Dito isso, o primeiro agente da OpenAI é uma prova de conceito impressionante — e uma interface — para uma IA que pode usar a interface de qualquer site. Mas, para criar sistemas de IA verdadeiramente independentes, as empresas de tecnologia precisarão desenvolver modelos de IA mais confiáveis que não requeiram tanta orientação.
Um pouco ‘mão na massa’
Meu teste do Operator coincidiu com a semana em que eu estava mudando de apartamento, então pedi a ajuda do agente da OpenAI com a logística da mudança.
Eu pedi ao Operator que me ajudasse a comprar um novo estacionamento. O agente da OpenAI me disse: “Claro”, e então abriu uma janela no seu navegador na tela do meu PC.
O Operator então fez uma busca por um estacionamento em San Francisco no navegador, me levou ao site da cidade correto e até à página certa.
O Operator ainda permite que você use o resto do seu computador enquanto trabalha, algo que não pode ser dito sobre o Project Mariner do Google. Isso porque o agente da OpenAI não está realmente trabalhando no computador, mas sim, hospedado na nuvem em algum lugar.
Para meu estacionamento, tive que conceder permissão ao Operator para iniciar diferentes processos algumas vezes demais. Ele também parou para me perguntar para preencher formulários com informações pessoais – como meu nome, número de telefone e endereço de e-mail. Às vezes, o Operator também se perdeu, obrigando-me a assumir o controle do navegador e colocar o agente de volta nos trilhos.
Em outro teste, pedi ao Operator que fizesse uma reserva em um restaurante grego. Para seu crédito, o Operator encontrou um bom lugar na minha área com preços razoáveis. Mas eu tive que responder mais de meia dúzia de perguntas ao longo do processo.
Se você precisa intervir seis ou mais vezes apenas para reservar uma mesa através de um agente de IA, em que momento é mais fácil apenas fazer você mesmo? Essa é uma pergunta que fiz a mim mesmo muitas vezes ao testar o Operator.
Agente como uma plataforma
Em alguns dos meus testes, encontrei websites que bloquearam o Operator por algum motivo. Por exemplo, tentei reservar um eletricista usando o TaskRabbit, mas o agente da OpenAI me informou que encontrou um erro e perguntou se poderia usar um serviço alternativo. Expedia, Reddit e YouTube também bloquearam o agente de IA de acessar suas plataformas.
No entanto, outros serviços estão recebendo o Operator de braços abertos. Instacart, Uber e eBay colaboraram com a OpenAI para o lançamento do Operator, permitindo que o agente navegue em seus websites em nome dos humanos.
Essas empresas estão se preparando para um futuro onde uma parte das interações dos usuários será facilitada por um agente de IA.
“Os clientes estão usando o Instacart através de uma variedade de diferentes pontos de entrada”, disse Daniel Danker, chefe de produto da Instacart, em uma entrevista ao TechCrunch. “Vemos o Operator como, potencialmente, mais um desses pontos de entrada.”
Permitir que o agente da OpenAI use o site do Instacart em nome de uma pessoa parece que separaria o Instacart de seus clientes. No entanto, Danker afirma que o Instacart quer encontrar os clientes onde quer que eles estejam.
“Realmente acreditamos, assim como a OpenAI, que sistemas agentes terão um impacto significativo sobre como os consumidores interagem com propriedades digitais”, disse o chefe de IA da eBay, Nitzan Mekel-Bobrov, em uma entrevista ao TechCrunch.
Mesmo que os agentes de IA aumentem em popularidade, Mekel-Bobrov diz que espera que os usuários sempre acessem o site da eBay, observando que “destinos online não estão desaparecendo.”
Questões de confiança
Tive alguns problemas em confiar no Operator depois que ele alucinhou algumas vezes, e quase me custou algumas centenas de dólares.
Por exemplo, pedi ao agente que encontrasse uma garagem perto do meu novo apartamento. Ele acabou sugerindo duas garagens que, segundo ele, levariam apenas alguns minutos a pé.
Além de estar bem acima da minha faixa de preço, as garagens estavam realmente muito longe do meu apartamento. Uma estava a 20 minutos a pé e a outra a 30 minutos. Acontece que o Operator havia colocado o endereço errado.
Isso é exatamente o motivo pelo qual a OpenAI não fornece ao seu agente seu número de cartão de crédito, senhas ou acesso ao e-mail. Se a OpenAI não tivesse me deixado intervir aqui, o Operator teria desperdiçado centenas de dólares em um estacionamento que eu não precisava.
Alucinações como essa são um obstáculo crucial para agentes autônomos realmente úteis – aqueles que podem tirar tarefas incômodas do seu prato. Ninguém confiará em agentes se eles forem propensos a cometer erros básicos, especialmente erros com consequências no mundo real.
Com o Operator, a OpenAI parece ter construído algumas ferramentas impressionantes que permitem que sistemas de IA naveguem na web. Mas essas ferramentas não vão valer muito até que a IA subjacente possa fazer de forma confiável o que os usuários pedem. Até lá, os humanos continuarão a ajudar os agentes — e não o contrário. E isso meio que derrota o objetivo.
Conteúdo relacionado
Treinamento de Agentes de IA em Ambientes Controlados os Fazem Exceler em Caos
[the_ad id="145565"] A maioria dos treinamentos de IA segue um princípio simples: alinhar suas condições de treinamento ao mundo real. Mas novas pesquisas do MIT estão…
StackAdapt do Canadá arrecada $235 milhões para sua plataforma programática baseada em IA
[the_ad id="145565"] Enquanto os Estados Unidos e o Canadá discutem sobre tarifas entre os dois países, uma empresa de tecnologia com sede em Toronto está anunciando uma rodada…
IA Acabou de Simular 500 Milhões de Anos de Evolução – E Criou uma Nova Proteína!
[the_ad id="145565"] A evolução tem aprimorado a vida em nível molecular por bilhões de anos. As proteínas, os blocos fundamentais da vida, evoluíram através desse processo…