Antes das festividades, a Microsoft anunciou que estava atualizando o modelo de IA por trás do Bing Image Creator, a ferramenta de edição de imagens com inteligência artificial integrada ao mecanismo de busca Bing da empresa. A Microsoft prometeu que o novo modelo — a última versão do modelo DALL-E 3 da OpenAI, codinome PR16 — permitiria que os usuários criassem imagens “duas vezes mais rápido do que antes” com “qualidade superior”.
Mas não cumpriu. Reclamações rapidamente inundaram o X e o Reddit.
“O DALL-E que costumávamos amar se foi para sempre,” disse um usuário do Reddit. “Estou usando o ChatGPT agora porque o Bing se tornou inútil para mim,” escreveu outro.
A reação foi tão intensa que a Microsoft anunciou que irá restaurar o modelo anterior ao Bing Image Creator até que consiga resolver os problemas.
traga de volta o velho dalle 3! a qualidade das imagens é muito melhor no modelo antigo. como essas imagens, por exemplo. a imagem gerada pelo novo modelo é uma M…. 🙁 pic.twitter.com/BjIM8MS4ng
— ze ᡣ𐭩ྀིྀི (@riegrowl) 28 de dezembro de 2024
“Conseguimos [reproduzir] alguns dos problemas relatados e planejamos reverter para [DALL-E 3] PR13 até que possamos corrigir,” disse Jordi Ribas, chefe de pesquisa da Microsoft, em uma postagem no X na noite de terça-feira. “O processo de implantação é muito lento, infelizmente. Começou há mais de uma semana e levará de 2 a 3 semanas para chegar a 100%.”
Então, o que deu errado?
É difícil comparar as saídas do modelo a partir de relatos anedóticos, particularmente quando os prompts não são padronizados. Mas muitos usuários disseram que o PR16 tendia a fazer imagens parecerem menos realistas. Mayank Parmar, escrevendo para Windows Latest, observou que as imagens geradas pelo PR16 careciam de detalhes e acabamento, e pareciam estranhamente cartunescas e “sem vida”.
Não sei quem você pensa que está enganando com isso. O DALL-E é objetivamente pior do que nunca após essa “atualização” e você está sendo superado por outras empresas como o Google. É absolutamente noite e dia comparar a qualidade das imagens agora com apenas alguns meses atrás pic.twitter.com/EdSdk7aign
— outward (@roccynoxy) 19 de dezembro de 2024
Não é a primeira vez que um modelo de imagem que supostamente passou por verificações internas não foi bem recebido publicamente. Em fevereiro, o Google foi forçado a pausar a capacidade de seu chatbot de IA Gemini de criar imagens de pessoas após os usuários reclamarem sobre inconsistências históricas.
Os erros ilustram o quão desafiador pode ser medir as melhorias dos modelos no mundo real. Segundo Ribas, a avaliação da Microsoft descobriu que a qualidade do PR16 era “um pouco melhor em média” em comparação com o modelo anterior do Bing Image Creator.
Qualquer métrica interna que a empresa utilizou, parece claro que não se alinhou com as preferências da maioria das pessoas.
A TechCrunch tem um boletim informativo focado em IA! Inscreva-se aqui para recebê-lo em sua caixa de entrada todas as quartas-feiras.
Conteúdo relacionado
A Intel já recebeu $2,2 bilhões em subsídios federais para a produção de chips.
[the_ad id="145565"] A gigante do semicondutor Intel Corporation já recebeu $2,2 bilhões em subsídios federais do Departamento de Comércio dos EUA por meio da Lei CHIPS e…
Ex-líderes do Google e Meta lançam a Palona AI, trazendo agentes de atendimento personalizados e emocionais para empresas não tecnológicas
[the_ad id="145565"] Participe das nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de liderança no setor. Saiba…
A Índia elogia o laboratório de IA chinês DeepSeek e planeja hospedar seus modelos em servidores locais.
[the_ad id="145565"] O ministro de TI da Índia elogiou, na quinta-feira, o progresso da DeepSeek e afirmou que o país hospedará os modelos de linguagem de grande porte do…