- Meta é acionada em ação de cinco grandes editoras (Macmillan, McGraw-Hill, Elsevier, Hachette e Cengage) e um autor, que alegam violação de direitos autorais ao treinar o modelo de IA Llama.
- Os autores dizem que a Meta copiou repetidamente obras protegidas sem permissão, supostamente de sites como LibGen, Anna’s Archive, Sci-Hub e Sci-Mag, além de usar o conjunto de dados Common Crawl.
- A ação afirma que o treinamento fez com que o Llama reproduzisse conteúdos protegidos de forma literal ou quase literal e dê continuidade de trechos, como em exemplos citados no processo.
- Os demandantes cobram indenização e pedem que o tribunal determine o bloqueio das atividades consideradas ilegais e exija uma lista das obras usadas no treinamento.
- A Meta afirma, por meio de nota, que vai contestar o processo, destacando que o uso de material protegido para treinamento de IA pode qualificar como fair use e que continuará lutando.
A Meta enfrenta uma ação coletiva movida por cinco grandes editorais e um autor, que acusam a empresa de realizar um dos maiores membros de violação de direitos autorais ao treinar seus modelos de IA, incluindo o Llama. A denúncia foi apresentada após reportagens do The New York Times e cita cópia repetida de livros e artigos sem autorização. A queixa envolve supostos usos de materiais obtidos em sites de pirataria e no conjunto Common Crawl.
As editoras Macmillan, McGraw-Hill, Elsevier, Hachette e Cengage, além do autor Scott Turow, alegam ter seus trabalhos incorporados sem permissão. A ação afirma que a Meta alimentou o Llama com conteúdos de sites como LibGen, Anna’s Archive e Sci-Hub, além de dados do Common Crawl. Segundo os autores, o modelo gera trechos idênticos ou muito próximos de obras protegidas.
A demanda busca reparação de danos e a suspensão de atividades consideradas ilegais, além de exigir a lista completa de obras utilizadas no treinamento. A defesa da Meta afirma que o uso de dados para treinar IA pode configurar uso legítimo e comunicou que enfrentará o processo de forma contundente.
Detalhes da ação
O processo descreve exemplos de saídas do Llama que reproduzem partes de obras com direitos autorais, citando materiais da editora Cengage. A ação também compara casos semelhantes envolvendo outras empresas de IA e cita decisões judiciais anteriores, sem indicar conclusão final sobre a legalidade do treinamento com dados protegidos.
Entre as partes envolvidas, além de Turow e as editoras, há um histórico de litígios sobre direitos autorais envolvendo IA. Autoridades judiciais abririam caminho para debates sobre o equilíbrio entre inovação tecnológica e proteção de obras criativas. A Meta frisa que continuará essencial para avanços em IA, com foco em usos legais.
Entre na conversa da comunidade