Antes das festividades, a Microsoft anunciou que estava atualizando o modelo de IA por trás do Bing Image Creator, a ferramenta de edição de imagens com inteligência artificial integrada ao mecanismo de busca Bing da empresa. A Microsoft prometeu que o novo modelo — a última versão do modelo DALL-E 3 da OpenAI, codinome PR16 — permitiria que os usuários criassem imagens “duas vezes mais rápido do que antes” com “qualidade superior”.
Mas não cumpriu. Reclamações rapidamente inundaram o X e o Reddit.
“O DALL-E que costumávamos amar se foi para sempre,” disse um usuário do Reddit. “Estou usando o ChatGPT agora porque o Bing se tornou inútil para mim,” escreveu outro.
A reação foi tão intensa que a Microsoft anunciou que irá restaurar o modelo anterior ao Bing Image Creator até que consiga resolver os problemas.
traga de volta o velho dalle 3! a qualidade das imagens é muito melhor no modelo antigo. como essas imagens, por exemplo. a imagem gerada pelo novo modelo é uma M…. 🙁 pic.twitter.com/BjIM8MS4ng
— ze ᡣ𐭩ྀིྀི (@riegrowl) 28 de dezembro de 2024
“Conseguimos [reproduzir] alguns dos problemas relatados e planejamos reverter para [DALL-E 3] PR13 até que possamos corrigir,” disse Jordi Ribas, chefe de pesquisa da Microsoft, em uma postagem no X na noite de terça-feira. “O processo de implantação é muito lento, infelizmente. Começou há mais de uma semana e levará de 2 a 3 semanas para chegar a 100%.”
Então, o que deu errado?
É difícil comparar as saídas do modelo a partir de relatos anedóticos, particularmente quando os prompts não são padronizados. Mas muitos usuários disseram que o PR16 tendia a fazer imagens parecerem menos realistas. Mayank Parmar, escrevendo para Windows Latest, observou que as imagens geradas pelo PR16 careciam de detalhes e acabamento, e pareciam estranhamente cartunescas e “sem vida”.
Não sei quem você pensa que está enganando com isso. O DALL-E é objetivamente pior do que nunca após essa “atualização” e você está sendo superado por outras empresas como o Google. É absolutamente noite e dia comparar a qualidade das imagens agora com apenas alguns meses atrás pic.twitter.com/EdSdk7aign
— outward (@roccynoxy) 19 de dezembro de 2024
Não é a primeira vez que um modelo de imagem que supostamente passou por verificações internas não foi bem recebido publicamente. Em fevereiro, o Google foi forçado a pausar a capacidade de seu chatbot de IA Gemini de criar imagens de pessoas após os usuários reclamarem sobre inconsistências históricas.
Os erros ilustram o quão desafiador pode ser medir as melhorias dos modelos no mundo real. Segundo Ribas, a avaliação da Microsoft descobriu que a qualidade do PR16 era “um pouco melhor em média” em comparação com o modelo anterior do Bing Image Creator.
Qualquer métrica interna que a empresa utilizou, parece claro que não se alinhou com as preferências da maioria das pessoas.
A TechCrunch tem um boletim informativo focado em IA! Inscreva-se aqui para recebê-lo em sua caixa de entrada todas as quartas-feiras.
Conteúdo relacionado
A Intel não lançará seu chip de IA Falcon Shores no mercado.
[the_ad id="145565"] A Intel está efetivamente encerrando o Falcon Shores, sua GPU de próxima geração para computação de alto desempenho e cargas de trabalho de IA. Essa…
Google anuncia discretamente seu próximo modelo de IA de destaque
[the_ad id="145565"] Atualização: Alguns usuários nas redes sociais relatam que o changelog foi atualizado para remover menção ao Gemini 2.0 Pro Experimental. As referências…
O CEO da Apple diz que o DeepSeek demonstra ‘inovação que impulsiona a eficiência’
[the_ad id="145565"] O CEO da Apple, Tim Cook, afirmou que os modelos de IA da DeepSeek representam "uma inovação que impulsiona a eficiência" durante uma teleconferência de…