Novos processos judiciais em um caso de direitos autorais relacionado à IA contra a Meta fortalecem a credibilidade de relatórios anteriores que afirmam que a empresa “pausou” discussões com editoras de livros sobre acordos de licenciamento para fornecer alguns de seus modelos de IA generativa com dados de treinamento.
Os novos documentos estão relacionados ao caso Kadrey v. Meta Platforms — um de muitos casos semelhantes que estão tramitando pelo sistema judicial dos EUA, envolvendo empresas de IA contra autores e outros detentores de direitos de propriedade intelectual. A maior parte dos réus nesses casos — as empresas de IA — alega que o treinamento em conteúdo protegido por direitos autorais é um “uso justo”. Os autores — detentores de direitos autorais — discordam veementemente.
Os novos documentos apresentados ao tribunal na sexta-feira, que incluem transcrições parciais de depoimentos de funcionários da Meta colhidos pelos advogados dos autores no caso, sugerem que alguns funcionários da Meta acreditavam que negociar licenças de dados para treinamento de IA com editoras poderia não ser escalável.
De acordo com uma transcrição, Sy Choudhury, que lidera as iniciativas de parceria de IA da Meta, disse que a abordagem da Meta a várias editoras foi recebida com “um progresso muito lento em engajamento e interesse.”
“Não me lembro de toda a lista, mas recordo que tivemos uma longa lista inicialmente conversando pela Internet com as principais editoras, etc.,” disse Choudhury, segundo a transcrição, “e não obtivemos contato e feedback de — de muitas das nossas tentativas de contato frio para tentar estabelecer contato.”
Choudhury acrescentou: “Houve algumas que realmente se engajaram, mas não muitas.”
De acordo com as transcrições do tribunal, a Meta pausou certos esforços de licenciamento de livros relacionados à IA no início de abril de 2023, após enfrentar “questões de timing” e outros contratempos logísticos. Choudhury disse que algumas editoras, em particular editoras de livros de ficção, descobriram que na verdade não tinham os direitos sobre os conteúdos que a Meta estava considerando licenciar, conforme a transcrição.
“Gostaria de destacar que, na categoria de ficção, rapidamente aprendemos com a equipe de desenvolvimento de negócios que a maioria das editoras com as quais estávamos conversando estava afirmando que na verdade não tinham os direitos para licenciar os dados para nós,” disse Choudhury. “E por isso levaria muito tempo para engajar todos os seus autores.”
Choudhury observou durante seu depoimento que a Meta já havia pausado esforços de licenciamento relacionados ao desenvolvimento de IA em pelo menos outra ocasião, segundo uma transcrição.
“Estou ciente de esforços de licenciamento como, por exemplo, tentamos licenciar mundos 3D de diferentes motores de jogos e fabricantes de jogos para nossa equipe de pesquisa em IA,” disse Choudhury. “E da mesma forma que estou descrevendo aqui para dados de ficção e de livros didáticos, tivemos muito pouco engajamento para sequer ter uma conversa […] Decidimos — nesse caso, decidimos construir nossa própria solução.”
Os advogados dos autores, que incluem os renomados autores Sarah Silverman e Ta-Nehisi Coates, alteraram sua reclamação várias vezes desde que o caso foi arquivado no Tribunal Distrital dos EUA para o Distrito Norte da Califórnia, Divisão de São Francisco, em 2023. A mais recente reclamação alterada submetida pelos advogados dos autores alega que a Meta, entre outras ofensas, cruzou referências de certos livros pirateados com livros protegidos por direitos autorais disponíveis para licenciamento para determinar se fazia sentido buscar um acordo de licenciamento com uma editora.
A reclamação também acusa a Meta de usar “bibliotecas furtivas” contendo e-books pirateados para treinar vários dos modelos de IA da empresa, incluindo sua popular série Llama de modelos “abertos”. Segundo a reclamação, a Meta pode ter obtido algumas das bibliotecas por meio de torrenting. O torrenting, uma forma de distribuir arquivos pela web, exige que os torrenters simultaneamente “semeiem” ou enviem os arquivos que estão tentando obter — o que os autores afirmaram ser uma forma de violação de direitos autorais.
Conteúdo relacionado
Peter Diamandis responde à pergunta: A longevidade é apenas para os ricos?
[the_ad id="145565"] No episódio desta semana do StrictlyVC Download, a Editora Chefe do TechCrunch, Connie Loizos, e Alex Gove, da StrictlyVC, recebem o empreendedor,…
OpenAI irá lançar modelo de código aberto à medida que a economia da IA força uma mudança estratégica
[the_ad id="145565"] Certainly! Here’s the rewritten content in Portuguese while maintaining the HTML tags: <div> <div id="boilerplate_2682874"…
$40 bilhões para o fogo: À medida que a OpenAI ganha um milhão de usuários por hora, a corrida pela dominância em IA corporativa acelera em um novo nível.
[the_ad id="145565"] Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdos exclusivos sobre cobertura de IA líder de indústria.…