Participe de nossos boletins diários e semanais para receber as últimas atualizações e conteúdo exclusivo sobre a cobertura líder da indústria em IA. Saiba mais
A OpenAI está lançando um conjunto de atualizações significativas para sua nova API de Respostas, com o objetivo de facilitar para desenvolvedores e empresas a criação de aplicações inteligentes e orientadas para ações.
Essas melhorias incluem suporte para servidores remotos do Model Context Protocol (MCP), integração de geração de imagens e ferramentas de Interprete de Código, além de upgrades nas capacidades de busca de arquivos—tudo disponível a partir de hoje, 21 de maio.
Iniciada em março de 2025, a API de Respostas serve como a caixa de ferramentas da OpenAI para desenvolvedores terceiros construírem aplicações agentic baseadas em algumas das funcionalidades centrais de seus serviços populares, como ChatGPT e seus agentes de IA internos, Deep Research e Operator.
Nos meses desde seu lançamento, a API processou trilhões de tokens e apoiou uma ampla gama de casos de uso, desde pesquisas de mercado e educação até desenvolvimento de software e análise financeira.
Aplicativos populares construídos com a API incluem o agente de codificação da Zencoder, o assistente de inteligência de mercado da Revi e a plataforma educacional da MagicSchool.
A base e o propósito da API de Respostas
A API de Respostas foi lançada juntamente com o SDK de Agentes de código aberto da OpenAI em março de 2025, como parte de uma iniciativa para fornecer acesso aos desenvolvedores terceiros às mesmas tecnologias que alimentam os próprios agentes de IA da OpenAI, como Deep Research e Operator.
Dessa forma, startups e empresas externas à OpenAI poderiam integrar a mesma tecnologia que a OpenAI oferece através do ChatGPT em seus próprios produtos e serviços, sejam internos para uso de funcionários ou externos para clientes e parceiros.
Inicialmente, a API combinou elementos das APIs de Conclusões de Chat e Assistentes—oferecendo ferramentas integradas para busca na web e em arquivos, além do uso de computadores—permitindo que os desenvolvedores construíssem fluxos de trabalho autônomos sem lógica de orquestração complexa. A OpenAI afirmou na época que a API de Conclusões de Chat seria descontinuada até junho de 2026.
A API de Respostas fornece visibilidade sobre as decisões do modelo, acesso a dados em tempo real e capacidades de integração que permitem que os agentes recuperem, raciocinem e ajam sobre informações.
Esse lançamento marcou uma mudança rumo a dar aos desenvolvedores um kit de ferramentas unificado para criar agentes de IA prontos para produção e específicos para domínios com mínima fricção.
O suporte a servidores MCP remotos amplia o potencial de integração
Uma adição fundamental nesta atualização é o suporte para servidores MCP remotos. Os desenvolvedores agora podem conectar os modelos da OpenAI a ferramentas e serviços externos, como Stripe, Shopify e Twilio, utilizando apenas algumas linhas de código. Essa capacidade permite a criação de agentes que podem realizar ações e interagir com sistemas que os usuários já dependem. Para apoiar esse ecossistema em evolução, a OpenAI se juntou ao comitê de diretoria do MCP.
A atualização traz novas ferramentas integradas à API de Respostas que aprimoram o que os agentes podem fazer em uma única chamada à API.
Uma variante do popular modelo de geração de imagens nativo GPT-4o da OpenAI—que inspirou uma onda de memes de animação no estilo “Studio Ghibli” na web e sobrecarregou os servidores da OpenAI com sua popularidade, embora possa obviamente criar muitos outros estilos de imagem—já está disponível através da API sob o nome de modelo “gpt-image-1.” Inclui novos recursos potencialmente úteis e bastante impressionantes, como visualizações em streaming em tempo real e refinamento de múltiplas interações.
Isso permite que os desenvolvedores construam aplicações que podem produzir e editar imagens dinamicamente em resposta à entrada do usuário.
Além disso, a ferramenta de Interprete de Código agora está integrada à API de Respostas, permitindo que os modelos lidem com análise de dados, matemática complexa e tarefas baseadas em lógica dentro de seus processos de raciocínio.
A ferramenta ajuda a melhorar o desempenho do modelo em vários benchmarks técnicos e permite comportamentos de agentes mais sofisticados.
Busca de arquivos e manuseio de contexto aprimorados
A funcionalidade de busca de arquivos também foi aprimorada. Os desenvolvedores agora podem realizar buscas em múltiplos armazéns vetoriais e aplicar filtragem baseada em atributos para recuperar apenas o conteúdo mais relevante.
Isso melhora a precisão das informações que os agentes utilizam, aprimorando sua capacidade de responder a perguntas complexas e operar dentro de grandes domínios de conhecimento.
Novas funcionalidades de confiabilidade e transparência para empresas
Vários recursos são projetados especificamente para atender às necessidades empresariais. O modo em segundo plano permite a execução de tarefas assíncronas de longa duração, resolvendo problemas de tempo limite ou interrupções de rede durante o raciocínio intensivo.
Os resumos de raciocínio, uma nova adição, oferecem explicações em linguagem natural do processo interno de pensamento do modelo, ajudando na depuração e transparência.
Itens de raciocínio criptografados fornecem uma camada adicional de privacidade para clientes de Zero Data Retention.
Esses itens permitem que os modelos reutilizem etapas de raciocínio anteriores sem armazenar dados nos servidores da OpenAI, melhorando tanto a segurança quanto a eficiência.
As capacidades mais recentes são suportadas em toda a série GPT-4o da OpenAI, na série GPT-4.1, e nos modelos da série o, incluindo o3 e o4-mini. Esses modelos agora mantêm o estado de raciocínio ao longo de múltiplas chamadas de ferramentas e requisições, o que resulta em respostas mais precisas a um custo e latência menores.
O preço de ontem É o preço de hoje!
Apesar do conjunto expandido de recursos, a OpenAI confirmou que a precificação das novas ferramentas e capacidades da API de Respostas permanecerá consistente com as taxas existentes.
Por exemplo, a ferramenta de Interprete de Código é cobrada a $0.03 por sessão, e o uso de busca de arquivos é cobrado a $2.50 por 1.000 chamadas, com custos de armazenamento de $0.10 por GB por dia após o primeiro gigabyte gratuito.
A precificação da busca na web varia com base no modelo e no tamanho do contexto da busca, variando de $25 a $50 por 1.000 chamadas. A geração de imagens através da ferramenta gpt-image-1 também é cobrada de acordo com a resolução e o nível de qualidade, começando em $0.011 por imagem.
Todo o uso de ferramentas é cobrado de acordo com as taxas por token do modelo escolhido, sem marcação adicional para as capacidades recém-adicionadas.
O que vem a seguir para a API de Respostas?
Com essas atualizações, a OpenAI continua a expandir o que é possível com a API de Respostas. Os desenvolvedores ganham acesso a um conjunto mais rico de ferramentas e recursos prontos para empresas, enquanto as empresas podem agora construir aplicações inteiramente integradas, capazes e seguras, impulsionadas por IA.
Todos os recursos estão ativos a partir de 21 de maio, com detalhes de preços e implementação disponíveis na documentação da OpenAI.
Insights diários sobre casos de uso empresarial com VB Daily
Se você quer impressionar seu chefe, o VB Daily tem tudo o que você precisa. Nós trazemos informações sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights para o máximo ROI.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais newsletters do VB aqui.
Ocorreu um erro.

Conteúdo relacionado
As economias antecipadas para o Disrupt 2025 terminam em 25 de maio.
[the_ad id="145565"] O pássaro madrugador vê o futuro primeiro — e economiza mais. Como diz o ditado, “o pássaro madrugador pega o verme.” Mas na tecnologia — e na vida — na…
Enchant lança aceleradora sem equity para startups de jogos e IA.
[the_ad id="145565"] Enchant está lançando um novo acelerador de zero-equinócio para startups de jogos e IA, com inscrições agora abertas para seu programa de três meses. O…
Agentes de IA do Google trarão a web até você
[the_ad id="145565"] Nos últimos vinte anos, o Google tem apresentado às pessoas uma lista de links selecionados por algoritmo da web para qualquer consulta de pesquisa. No I/O…