Bolt42

Antes das festividades, a Microsoft anunciou que estava atualizando o modelo de IA por trás do Bing Image Creator, a ferramenta de edição de imagens com inteligência artificial integrada ao mecanismo de busca Bing da empresa. A Microsoft prometeu que o novo modelo — a última versão do modelo DALL-E 3 da OpenAI, codinome PR16 — permitiria que os usuários criassem imagens “duas vezes mais rápido do que antes” com “qualidade superior”.

Mas não cumpriu. Reclamações rapidamente inundaram o X e o Reddit.

“O DALL-E que costumávamos amar se foi para sempre,” disse um usuário do Reddit. “Estou usando o ChatGPT agora porque o Bing se tornou inútil para mim,” escreveu outro.

A reação foi tão intensa que a Microsoft anunciou que irá restaurar o modelo anterior ao Bing Image Creator até que consiga resolver os problemas.

“Conseguimos [reproduzir] alguns dos problemas relatados e planejamos reverter para [DALL-E 3] PR13 até que possamos corrigir,” disse Jordi Ribas, chefe de pesquisa da Microsoft, em uma postagem no X na noite de terça-feira. “O processo de implantação é muito lento, infelizmente. Começou há mais de uma semana e levará de 2 a 3 semanas para chegar a 100%.”

Então, o que deu errado?

É difícil comparar as saídas do modelo a partir de relatos anedóticos, particularmente quando os prompts não são padronizados. Mas muitos usuários disseram que o PR16 tendia a fazer imagens parecerem menos realistas. Mayank Parmar, escrevendo para Windows Latest, observou que as imagens geradas pelo PR16 careciam de detalhes e acabamento, e pareciam estranhamente cartunescas e “sem vida”.

Não é a primeira vez que um modelo de imagem que supostamente passou por verificações internas não foi bem recebido publicamente. Em fevereiro, o Google foi forçado a pausar a capacidade de seu chatbot de IA Gemini de criar imagens de pessoas após os usuários reclamarem sobre inconsistências históricas.

Os erros ilustram o quão desafiador pode ser medir as melhorias dos modelos no mundo real. Segundo Ribas, a avaliação da Microsoft descobriu que a qualidade do PR16 era “um pouco melhor em média” em comparação com o modelo anterior do Bing Image Creator.

Qualquer métrica interna que a empresa utilizou, parece claro que não se alinhou com as preferências da maioria das pessoas.

A TechCrunch tem um boletim informativo focado em IA! Inscreva-se aqui para recebê-lo em sua caixa de entrada todas as quartas-feiras.


    14 + dezesseis =

    Bolt42