Мете грозит иск за обучение ИИ с помощью пиратских книг

10 февраля, 2025 Дядя Влад

В недавнем судебном иске Meta была обвинена в использовании пиратских книг для обучения своих моделей искусственного интеллекта с одобрения генерального директора Марка Цукерберга. Согласно Ars Technica , иск, поданный такими авторами, как Та-Нехиси Коутс и Сара Сильверман, в федеральный суд Калифорнии, ссылается на внутренние сообщения Meta, указывающие на то, что компания использовала набор данных Library Genesis (LibGen) — обширный онлайн-репозиторий, известный размещением пиратских книг — несмотря на внутренние опасения по поводу законности использования таких материалов.

Авторы утверждают, что действия Meta нарушают их авторские права и могут подорвать позиции компании перед регуляторами. Они утверждают, что модели искусственного интеллекта Меты, в том числе Лама, были обучены с использованием их разработок без разрешения, что потенциально нанесло ущерб их средствам к существованию. Meta защищала свою практику, ссылаясь на доктрину «добросовестного использования», утверждая, что использование общедоступных материалов для обучения инструментов ИИ является законным в определенных случаях, например, «использование текста для статистического моделирования языка и создания оригинального выражения».

Распечатанные судебные документы от 5 февраля 2024 года по делу Кадрей против Меты показывают, что Мета (ранее Facebook) незаконно скачала 81,7 ТБ данных из «теневых библиотек»; такие как Anna's Archive, Z-Library и LibGen, для обучения мета-искусственного интеллекта.
Основные моменты включают в себя:
– Старший ИИ… pic.twitter.com/Bqf60Hhbb6
— vx-underground (@vxunderground) 8 февраля 2025 г.

В одном внутреннем сообщении, выделенном в иске, цитируется сотрудник, выражающий дискомфорт, заявляющий: «Использование торрентов с корпоративного ноутбука кажется неправильным».

В ответ на иск окружной судья США Винс Чабрия отклонил некоторые претензии, но разрешил авторам изменить свою жалобу, включив в нее новые обвинения, в том числе связанные с удалением информации об управлении авторскими правами. Это дело является частью более широкой волны судебных исков против таких технологических компаний, как Meta, OpenAI и Anthropic, где авторы и создатели стремятся защитить свои права интеллектуальной собственности перед лицом быстро развивающихся технологий искусственного интеллекта.

Исход этого иска может иметь серьезные последствия для технологической отрасли, особенно в отношении использования материалов, защищенных авторским правом, в обучении ИИ. Это поднимает важные вопросы о балансе между технологическими инновациями и защитой прав создателей.