O chatbot de IA DeepSeek tem causado um alvoroço mundial, liderando as paradas de aplicativos e levando Silicon Valley e Wall Street ao colapso.
Um desdobramento do fundo de hedge chinês High-Flyer, a relação custo-desempenho do DeepSeek é impressionante em comparação com concorrentes como a OpenAI. No entanto, relatórios têm documentado cada vez mais algumas das coisas que o chatbot de IA não está disposto a discutir, incluindo tópicos espinhosos como os protestos e massacres da Praça da Paz Celestial e Taiwan.
Um novo relatório da equipe da PromptFoo, uma startup apoiada pela Andreessen Horowitz que ajuda empresas a encontrar vulnerabilidades em aplicações de IA, descobriu que o modelo de raciocínio R1 do DeepSeek se recusou a responder cerca de 85% dos 1.360 “prompts” sobre tópicos sensíveis, e as respostas pré-formatadas do modelo estavam repletas de um “tom nacionalista exagerado” frequentemente oferecido em seu lugar.
Os pesquisadores também observaram que o DeepSeek pode ser facilmente desbloqueado, sugerindo que o laboratório chinês “implementou a censura do PCC [Partido Comunista Chinês] de uma maneira crua e contundente.”
O conjunto completo de dados de prompts sensíveis está disponível no Hugging Face.
Conteúdo relacionado
Google lança programa de “saída voluntária” para empregados do Android, Chrome e Pixel.
[the_ad id="145565"] Rick Osterloh, SVP do Google, enviou um memorando interno para a equipe de Pixel/Android/Chrome na quinta-feira, anunciando um “programa de saída…
Recurso ‘Peça por Mim’ do Google liga para empresas em seu nome para perguntar sobre serviços e preços
[the_ad id="145565"] O Google está testando um novo recurso chamado “Peça por Mim”, que utiliza IA para fazer chamadas a empresas locais em seu nome, para obter informações…
OpenAI supostamente em negociações para levantar $40 bilhões com uma avaliação de $340 bilhões.
[the_ad id="145565"] A OpenAI pode ter bilhões de dólares no banco. Mas está se preparando para arrecadar bilhões a mais, segundo um relatório do The Wall Street Journal. De…