OpenAI disponibiliza a geração de imagens do ChatGPT como API

Participe de nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA líder no setor. Saiba mais

As pessoas agora podem incorporar nativamente imagens inspiradas no Studio Ghibli geradas pelo ChatGPT em seus negócios. A OpenAI adicionou o modelo por trás de sua ferramenta de geração de imagens muito popular, usada no ChatGPT, à sua API.

O modelo gpt-image-1 permitirá que desenvolvedores e empresas “integrem a geração de imagens de alta qualidade e profissional diretamente em suas próprias ferramentas e plataformas.”

“A versatilidade do modelo permite que ele crie imagens em diversos estilos, siga fielmente diretrizes personalizadas, aproveite o conhecimento mundial e represente texto com precisão – desbloqueando inúmeras aplicações práticas em vários domínios,” disse a OpenAI em um postagem no blog.

Os preços da API separam tokens para texto e imagens. Os tokens de entrada de texto, ou texto do prompt, custarão $5 por 1 milhão de tokens. Tokens de entrada de imagem custarão $10 por milhão de tokens, enquanto tokens de saída de imagem, ou a imagem gerada, terão um custo de impressionantes $40 por milhão de tokens.

Concorrentes como a Stability AI oferecem um sistema baseado em créditos para sua API, onde um crédito equivale a $0.01. Usar seu principal produto, o Stable Image Ultra, custa oito créditos por geração. O modelo de geração de imagens do Google, o Imagen, cobra usuários pagantes $0.03 por imagem gerada usando a API Gemini.

Geração de imagens em um só lugar

A OpenAI permitiu que os usuários do ChatGPT gerassem e editassem imagens diretamente na interface de chat em abril, alguns meses depois de adicionar a geração de imagens ao ChatGPT por meio do modelo GPT-4o.

A empresa afirmou que a geração de imagens na plataforma de chat “rapidamente se tornou um de nossos recursos mais populares.” A OpenAI disse que mais de 130 milhões de usuários acessaram o recurso e criaram 700 milhões de fotos apenas na primeira semana.

No entanto, essa popularidade também apresentou desafios para a OpenAI. Usuários de mídias sociais rapidamente descobriram que podiam solicitar ao ChatGPT que gerasse imagens inspiradas pelo gigantesco estúdio de animação japonês Studio Ghibli, e, como resultado, meus feeds nas redes sociais estavam repletos das mesmas fotos durante todo o fim de semana. A tendência levou o CEO da OpenAI, Sam Altman, a afirmar que as GPUs da empresa “estão derretendo.”

A OpenAI anteriormente havia adicionado seu modelo de imagem DALL-E 3 ao ChatGPT. Esse modelo era um modelo de transformação por difusão, em vez do entendimento multimodal nativo que o GPT-4o possui.

Casos de uso empresariais

As empresas desejam a capacidade de gerar imagens para seus projetos e muitas não querem abrir um aplicativo separado para fazê-lo. Ao adicionar o modelo de imagem à sua API, a OpenAI permite que as empresas conectem o gpt-image-1 a seus próprios ecossistemas.

A OpenAI afirmou que já viu várias empresas e startups usando o modelo para projetos criativos, produtos e experiências, mencionando várias marcas conhecidas em sua postagem no blog.

A Canva está supostamente explorando maneiras de integrar o gpt-image-1 para suas ferramentas Canva AI e Magic Studio. A GoDaddy já começou a experimentar a geração de imagens para que os clientes criem seus logotipos, e a Airtable agora permite que equipes de marketing e criativas de empresas gerenciem facilmente fluxos de trabalho de ativos em grande escala.

A OpenAI disse que o gpt-image-1 terá as mesmas medidas de segurança na API que no ChatGPT. A empresa afirmou que imagens geradas com o modelo incluem nativamente metadados da Coalizão para Proveniência e Autenticidade de Conteúdo (C2PA) que rotulam o conteúdo como gerado por IA e rastreiam a propriedade. A OpenAI é parte do comitê de direção do C2PA.

Os usuários também podem controlar a moderação de conteúdo para gerar imagens que melhor se alinhem com suas marcas.

A OpenAI prometeu que não usará os dados da API dos clientes, incluindo quaisquer imagens carregadas ou geradas pelo gpt-image-1, para treinar seus modelos.

Insights diários sobre casos de uso empresarial com o VB Daily

Se você deseja impressionar seu chefe, o VB Daily tem tudo o que você precisa. Nós lhe damos os detalhes sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para o máximo retorno sobre investimento.

Leia nossa Política de Privacidade

Agradecemos por se inscrever. Confira mais newsletters do VB aqui.

Ocorreu um erro.