Bolt42

Na terça-feira, a OpenAI lançou novas ferramentas projetadas para ajudar desenvolvedores e empresas a construir agentes de IA — sistemas automatizados que podem realizar tarefas de forma independente — utilizando os próprios modelos e estruturas de IA da empresa.

As ferramentas fazem parte da nova Responses API da OpenAI, que permite que empresas desenvolvam agentes de IA personalizados capazes de realizar buscas na web, examinar arquivos da empresa e navegar em sites, muito parecido com o produto Operator da OpenAI. A Responses API substitui efetivamente a Assistants API da OpenAI, que a empresa planeja descontinuar na primeira metade de 2026.

A expectativa em torno dos agentes de IA cresceu dramaticamente nos últimos anos, apesar de a indústria de tecnologia ter lutado para mostrar às pessoas, ou mesmo definir, o que realmente são “agentes de IA”. No exemplo mais recente do hype em torno dos agentes superando a utilidade, a startup chinesa Butterfly Effect se tornou viral esta semana por causa de uma nova plataforma de agentes de IA chamada Manus, que os usuários rapidamente descobriram que não cumpria muitas das promessas da empresa.

Em outras palavras, as apostas são altas para a OpenAI conseguir acertar nos agentes.

“É bastante fácil demonstrar o seu agente”, disse Olivier Godement, chefe de produto da API da OpenAI, em uma entrevista ao TechCrunch. “Escalar um agente é bastante difícil, e fazer com que as pessoas o usem frequentemente é muito difícil.”

No início deste ano, a OpenAI apresentou dois agentes de IA no ChatGPT: Operator, que navega em sites em seu nome, e deep research, que compila relatórios de pesquisa para você. Ambas as ferramentas ofereceram um vislumbre do que a tecnologia agente pode alcançar, mas deixaram muito a desejar no departamento de “autonomia”.

Agora, com a Responses API, a OpenAI deseja vender acesso aos componentes que alimentam agentes de IA, permitindo que desenvolvedores construam suas próprias aplicações no estilo Operator e deep research. A OpenAI espera que os desenvolvedores possam criar algumas aplicações com sua tecnologia de agentes que sejam mais autônomas do que as disponíveis hoje.

Usando a Responses API, os desenvolvedores podem acessar os mesmos modelos de IA (em pré-visualização) que estão por trás da ferramenta de busca da web ChatGPT: GPT-4o search e GPT-4o mini search. Os modelos podem navegar na web para encontrar respostas a perguntas, citando fontes enquanto geram respostas.

A OpenAI afirma que o GPT-4o search e o GPT-4o mini search são altamente precisos em termos factuais. No benchmark SimpleQA da empresa, que mede a capacidade dos modelos de responder a perguntas breves e que buscam fatos, o GPT-4o search obtém 90% enquanto o GPT-4o mini search obtém 88% (quanto maior, melhor). Para comparação, o GPT-4.5 — o modelo muito maior e recentemente lançado pela OpenAI — pontua apenas 63%.

A Responses API também inclui uma ferramenta de busca de arquivos que pode rapidamente escanear arquivos nos bancos de dados de uma empresa para recuperar informações. (A OpenAI afirma que não treinará modelos com esses arquivos.) Além disso, os desenvolvedores que utilizam a Responses API podem acessar o modelo Computer-Using Agent (CUA) da OpenAI, que alimenta o Operator. O modelo gera ações de mouse e teclado, permitindo que os desenvolvedores automatizem tarefas de uso de computador, como entrada de dados e fluxos de trabalho de aplicativos.

As empresas podem opcionalmente executar o modelo CUA, que está sendo lançado em pré-visualização de pesquisa, localmente em seus próprios sistemas, afirmou a OpenAI. A versão do consumidor do CUA disponível no Operator pode apenas realizar ações na web.

Para ser claro, a Responses API não resolverá todos os problemas técnicos que afligem os agentes de IA hoje.

Embora as ferramentas de busca impulsionadas por IA sejam mais precisas do que os modelos de IA tradicionais — um fato que não surpreende, uma vez que podem simplesmente procurar a resposta correta — a busca na web não torna as alucinações de IA um problema resolvido. O GPT-4o search ainda erra 10% das perguntas factuais. Além de sua precisão, as ferramentas de busca em IA também tendem a ter dificuldades com consultas curtas e de navegação (como “resultado dos Lakers hoje”), e relatórios recentes sugerem que as citações do ChatGPT nem sempre são confiáveis.

Em um post no blog enviado ao TechCrunch, a OpenAI disse que o modelo CUA “ainda não é altamente confiável para automatizar tarefas em sistemas operacionais,” e que é suscetível a cometer erros “inadvertidos”.

No entanto, a OpenAI afirmou que estas são iterações iniciais de suas ferramentas de agentes, e que está constantemente trabalhando para melhorá-las.

Juntamente com a Responses API, a OpenAI está lançando um kit de ferramentas de código aberto chamado Agents SDK, que oferece aos desenvolvedores ferramentas gratuitas para integrar modelos com seus sistemas internos, implementar salvaguardas e monitorar atividades dos agentes de IA para fins de depuração e otimização. O Agents SDK é uma continuação do Swarm da OpenAI, uma estrutura para orquestração de múltiplos agentes que a empresa lançou no final do ano passado.

Godement disse que espera que a OpenAI possa fechar a lacuna entre as demonstrações de agentes de IA e os produtos este ano, e que, em sua opinião, “agentes são a aplicação de IA mais impactante que acontecerá.” Isso ecoa uma declaração feita pelo CEO da OpenAI, Sam Altman, em janeiro: que 2025 é o ano em que os agentes de IA entrarão na força de trabalho.

Se 2025 se tornará ou não o “ano do agente de IA”, os mais recentes lançamentos da OpenAI mostram que a empresa deseja passar de demonstrações de agentes chamativas para ferramentas impactantes.


    dois + 16 =

    Bolt42