Bolt42

Há uma nova tendência preocupante se espalhando: pessoas estão usando o ChatGPT para descobrir a localização mostrada em fotos.

Nesta semana, a OpenAI lançou seus mais novos modelos de IA, o3 e o4-mini, ambos capazes de “raciocinar” de forma única por meio de imagens enviadas. Na prática, os modelos podem recortar, rotacionar e ampliar fotos — até mesmo aquelas borradas ou distorcidas — para analisá-las minuciosamente.

Essas capacidades de análise de imagem, combinadas com a habilidade dos modelos de buscar na web, criam uma ferramenta poderosa de identificação de locais. Usuários no X rapidamente descobriram que o o3, em particular, é muito bom em deduzir cidades, marcos, e até restaurantes e bares a partir de sutis pistas visuais.

Em muitos casos, os modelos não parecem estar se baseando em “memórias” de conversas passadas do ChatGPT, ou em dados EXIF, que são os metadados anexados a fotos que revelam detalhes como onde a foto foi tirada.

O X está cheio de exemplos de usuários fornecendo ao ChatGPT cardápios de restaurantes, foto de bairros, fachadas, e autorretratos, e instruindo o o3 a imaginar que está jogando “GeoGuessr,” um jogo online que desafia os jogadores a adivinhar locais a partir de imagens do Google Street View.

É uma questão óbvia de privacidade. Não há nada impedindo um indivíduo mal-intencionado de fazer uma captura de tela de, digamos, uma Story do Instagram de alguém e usar o ChatGPT para tentar desmascará-lo.

Claro, isso poderia ser feito mesmo antes do lançamento do o3 e o4-mini. O TechCrunch testou várias fotos com o o3 e um modelo mais antigo sem capacidades de raciocínio de imagem, o GPT-4o, para comparar as habilidades de adivinhação de localização dos modelos. Surpreendentemente, o GPT-4o chegou à mesma resposta correta que o o3 com mais frequência — e levou menos tempo.

Houve pelo menos uma instância durante nossos breves testes em que o o3 encontrou um lugar que o GPT-4o não conseguiu. Dada uma imagem de uma cabeça de rinoceronte roxa montada em um bar mal iluminado, o o3 respondeu corretamente que era de um speakeasy em Williamsburg — e não, como o GPT-4o adivinhou, um pub do Reino Unido.

Isso não quer dizer que o o3 seja infalível nesse aspecto. Vários de nossos testes falharam — o o3 ficou preso em um loop, incapaz de chegar a uma resposta em que estivesse razoavelmente confiante, ou sugeriu uma localização errada. Usuários no X também notaram que o o3 pode ser bastante impreciso em suas deduções de localização.

Mas a tendência ilustra alguns dos riscos emergentes apresentados por modelos de IA mais avançados e chamados de raciocínio. Parece haver poucos salvaguardas implementadas para evitar esse tipo de “busca reversa de localização” no ChatGPT, e a OpenAI, a empresa por trás do ChatGPT, não aborda a questão em seu relatório de segurança para o o3 e o o4-mini.

Entramos em contato com a OpenAI para comentar. Atualizaremos nosso artigo assim que recebermos uma resposta.


    treze + 11 =

    Bolt42