Bolt42

Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de ponta. Saiba mais


A OpenAI está lançando um novo conjunto de APIs e ferramentas projetadas para ajudar desenvolvedores e empresas a construir agentes de IA mais eficientemente, utilizando a mesma tecnologia que alimenta seus próprios agentes de IA de primeira linha, como o Deep Research (que vasculha a internet de forma independente para desenvolver relatórios bem pesquisados, organizados e citados) e o Operator (ferramenta para controlar um cursor de navegador web autonomamente com base nas instruções de texto de um usuário, realizando ações como encontrar ingressos para esportes ou fazer reservas).

Agora, com acesso aos blocos de construção por trás desses poderosos agentes da OpenAI, os desenvolvedores podem criar seus próprios concorrentes de terceiros ou produtos e serviços mais especializados em função do seu caso de uso e público-alvo.

Os recentes avanços da OpenAI em raciocínio, processamento multimodal e mecanismos de segurança estabeleceram as bases para essas capacidades, especialmente suas famílias de modelos de raciocínio “o” (o1 e o3).

“É difícil subestimar o quão críticos são os modelos de raciocínio para permitir agentes de IA,” disse Olivier Godement, chefe de produto da plataforma da OpenAI, em uma chamada de vídeo com a VentureBeat. “Uma das maiores limitações antes era lidar com tarefas de longo prazo, como o planejamento.”

Mas a empresa afirma que os desenvolvedores ainda não tinham as ferramentas necessárias para integrá-los facilmente em aplicações prontas para a produção, até agora.

Para resolver esses obstáculos, a OpenAI está introduzindo várias novas ofertas: a Responses API, ferramentas integradas para busca na web e em arquivos, uma ferramenta de uso de computador, e o Agents SDK de código aberto. Enquanto a Responses API permite que os desenvolvedores construam agentes com base na sua tecnologia, o Agents SDK pode ajudá-los a ligar agentes a outras ferramentas e processos web, executando “fluxos de trabalho” que fazem o que o usuário ou empresa deseja de forma autônoma.

Essas ferramentas têm como objetivo simplificar o desenvolvimento de agentes de IA, reduzindo a necessidade de engenharia de prompt extensa e lógica de orquestração personalizada. Elas devem também tornar atraente a continuação da construção sobre a plataforma da OpenAI, mesmo diante da crescente concorrência de players chineses como Manus, Qwen da Alibaba, DeepSeek, e rivais locais como Anthropic e Google.

Embora outros players ofereçam ferramentas para desenvolvedores ou produtos, a evolução contínua da plataforma de desenvolvedores da OpenAI torna-a uma proposta difícil de superar como um “guarda-chuva” para aqueles que buscam alavancar os mais recentes avanços em IA de maneira limpa, fácil de usar, rápida e acessível.

Em um movimento certo para agitar a blogosfera de IA e as redes sociais, a OpenAI está retornando ao código aberto de forma significativa com o lançamento de seu Agents SDK, um conjunto de ferramentas projetadas para ajudar desenvolvedores a gerenciar, coordenar e otimizar fluxos de trabalho de agentes — possibilitando até a construção de agentes alimentados por outros modelos que não sejam da OpenAI, como os da Anthropic e Google, ou modelos de código aberto da DeepSeek, Qwen, Mistral e da família Llama da Meta.

“O Agents SDK é de código aberto, permitindo que as empresas mesclem e combine diferentes modelos,” disse Godement. “Não queremos forçar ninguém a usar apenas modelos da OpenAI.”

O SDK oferece recursos chave como:

Agentes Configuráveis – Modelos de IA com instruções predefinidas e acesso a ferramentas.

Transferências Inteligentes – Mecanismos para transferir tarefas entre agentes com base no contexto.

Guardrails Integrados – Medidas de segurança para validação de entrada e moderação de conteúdo.

Rastreamento e Observabilidade – Ferramentas para depuração e otimização do desempenho do agente.

“Com o Agents SDK, os desenvolvedores podem rastrear exatamente o que um agente está fazendo — quais tarefas ele gera, quais dados ele coleta e como ele gera respostas,” disse Nikunj Handa, PM da equipe de API da OpenAI, na mesma chamada de vídeo com a VentureBeat.

O que a nova Responses API oferece

No centro dessa atualização está a Responses API, que combina recursos da API de Conclusões de Chat da OpenAI com a funcionalidade de uso de ferramentas da API de Assistentes, que será descontinuada em meados de 2026, de acordo com a empresa.

Essa integração permite que os desenvolvedores aproveitem várias ferramentas integradas em uma única chamada da API, facilitando a construção de aplicações que requerem interações complexas e em múltiplos passos.

A Responses API suporta inicialmente três ferramentas integradas:

Busca na Web – Fornece respostas em tempo real e citadas, buscando informações na web.

Busca em Arquivos – Recupera informações relevantes de grandes repositórios de documentos usando filtragem de metadados e processamento de consultas otimizado.

Ferramenta de Uso de Computador – Permite que agentes de IA realizem ações em um computador, como navegação, entrada de dados e navegação em interfaces de software.

“Com a Responses API, os desenvolvedores têm mais visibilidade sobre o que o modelo está fazendo — quais ferramentas está chamando, por que está chamando e quais decisões está tomando antes e depois dessas chamadas,” disse Handa.

Com essas capacidades, a OpenAI visualiza a Responses API servindo como uma base para aplicações agentuais, eliminando a necessidade de múltiplas integrações externas. A API está disponível para todos os desenvolvedores a partir de hoje, com uso cobrado nas taxas padrão de token e ferramenta da OpenAI.

Além disso, a OpenAI observa que, enquanto a API de Conclusões de Chat continuará recebendo atualizações, a Responses API é considerada seu superconjunto. Desenvolvedores que precisam de ferramentas integradas ou interações de modelo em múltiplos passos devem usar a Responses API para novas integrações.

A OpenAI também está tornando suas ferramentas de busca na web, busca em arquivos e uso de computador disponíveis diretamente por meio da Responses API. Essas ferramentas permitem que agentes de IA acessem informações do mundo real, recuperem contexto de documentos e interajam mais efetivamente em ambientes digitais.

Busca na Web oferece aos desenvolvedores informações em tempo real com citações

A ferramenta de busca na web permite que os desenvolvedores integrem capacidades de busca em tempo real em suas aplicações, tornando-a útil para assistentes de pesquisa, guias de compras e ferramentas de agregação de conteúdo. Ela fornece fontes para suas respostas, garantindo que os usuários possam verificar a precisão das informações.

“A primeira coisa que estamos lançando são ferramentas integradas, como a busca na web, que permite que modelos acessem informações em tempo real,” disse Handa. “É a mesma ferramenta que alimenta a Busca do ChatGPT, e agora estamos trazendo para a API.”

A OpenAI também confirmou que os resultados da busca na web na API incluirão citações claras, permitindo que os usuários cliquem nas fontes originais. Os desenvolvedores podem implementar a busca na web como parte de um sistema de recuperação mais amplo que inclui fontes de dados proprietárias.

Busca em Arquivos: recuperação inteligente de documentos em nuvens privadas

Com a ferramenta de busca em arquivos, agentes de IA podem recuperar rapidamente informações relevantes de grandes coleções de documentos. Essa ferramenta suporta múltiplos formatos de arquivo e inclui recursos como otimização de consultas, filtragem de metadados e classificação personalizada para resultados mais precisos.

“A terceira ferramenta que estamos lançando é a busca em arquivos, que facilita para os desenvolvedores levar todos os seus dados, armazená-los em nosso sistema e extrair as informações certas com alta precisão,” explicou Handa.

A ferramenta de busca em arquivos é cobrada a $2,50 por mil consultas, com taxas de armazenamento de $0,10 por GB por dia (o primeiro GB é gratuito).

Os desenvolvedores agora também podem acessar a Ferramenta de Uso de Computador, a tecnologia que alimenta o Operator da OpenAI

A ferramenta de uso de computador amplia as capacidades do agente além de tarefas simples baseadas em texto, permitindo que a IA interaja com interfaces de computador.

Alimentada pelo modelo de agente que usa computador (CUA) da OpenAI, essa ferramenta traduz ações geradas pela IA em comandos executáveis, permitindo a automação de tarefas como entrada de dados e navegação na web.

“Estamos também lançando uma ferramenta de uso de computador, permitindo que os modelos interajam com interfaces gráficas de usuário quando não há uma API existente para uma tarefa,” observou Handa.

A ferramenta de uso de computador está atualmente disponível como uma prévia de pesquisa para desenvolvedores selecionados nas categorias de uso 3-5. Os preços são definidos em $3 por milhão de tokens de entrada e $12 por milhão de tokens de saída.

O que isso significa para líderes empresariais

Para líderes de equipes de TI, CTOs e gerentes de nível médio que buscam otimizar fluxos de trabalho, as novas ferramentas da OpenAI fornecem um caminho claro para automatizar e escalar processos impulsionados por IA, sem exigir desenvolvimento personalizado extensivo.

As capacidades integradas de busca na web e busca em arquivos permitem que as empresas integrem rapidamente a recuperação de informações impulsionada por IA em seus sistemas existentes, enquanto a ferramenta de uso de computador possibilita interações automatizadas com aplicações legadas que não possuem acesso à API.

O Agents SDK de código aberto empodera ainda mais as organizações a coordenar fluxos de trabalho impulsionados por IA entre equipes, facilitando a implantação de agentes que melhoram a eficiência em áreas como suporte ao cliente, processamento de documentos e pesquisa de mercado.

Com segurança e observabilidade empresarial incorporadas nessas ferramentas, os tomadores de decisão podem adotar soluções de IA com maior transparência e controle, garantindo conformidade e monitoramento de desempenho em larga escala.

O que vem a seguir?

A OpenAI vê esses novos lançamentos como o primeiro passo na construção de uma plataforma abrangente para agentes de IA. A empresa planeja lançar ferramentas adicionais e integrações nos próximos meses para ajudar os desenvolvedores a implantar, avaliar e escalar aplicações agentais de maneira mais eficaz.

“Acreditamos que os próximos meses serão críticos para implantar cada vez mais agentes em larga escala,” disse Godement. “Já fizemos isso com agentes de primeira linha como o Deep Research, mas a OpenAI não vai construir todos os agentes—é por isso que temos uma plataforma de desenvolvedores.”

A OpenAI também afirmou que continuará a melhorar os recursos de segurança para aplicações agentais, incluindo salvaguardas contra injeções de prompt e acesso não autorizado a dados.

Desenvolvedores interessados em construir com as novas ferramentas podem explorar a documentação e o playground de API da OpenAI para começar hoje.





    onze + 17 =




    Bolt42