Откажитесь от “белой проституции”! Тысячи писателей высказываются: генеративный ИИ также должен платить сборы за авторские права

20 июля, 2023 Дядя Влад

В конце концов, генеративный ИИ, основанный на большой языковой модели, все еще «возмущен»!

Более 8500 авторов художественной, документальной и поэтической литературы недавно подписали открытое письмо лидерам в области генеративного ИИ, призывающее руководителей OpenAI, Alphabet, Meta, Stability AI, IBM и Microsoft добиваться согласия, признавать и справедливо компенсировать авторов, которые используют материалы, защищенные авторским правом, при обучении ИИ.

"Технологии генеративного ИИ, основанные на больших языковых моделях, обязаны своим существованием нашей работе,— говорится в письме.— Эти техники имитируют и анализируют наш язык, истории, стили и идеи".

Это утверждение может быть предвзятым, но если мы посмотрим на то, как работает технология генеративного ИИ, оно не лишено смысла.

В частности, генеративный ИИ работает с использованием моделей машинного обучения для изучения шаблонов и взаимосвязей в созданных людьми наборах данных контента, а затем использует изученные шаблоны для создания нового контента. Среди них предварительно обученные данные служат «нефтяным» топливом.

Взяв в качестве примера популярный в настоящее время ChatGPT, общедоступные данные показывают, что объем обучающих данных ChatGPT представляет собой языковой корпус из 800 миллиардов слов, включая 175 миллиардов параметров, а объем данных перед обучением достигает 45 ТБ.

Интересно, что источник такого огромного датасета ChatGPT всегда был «покрыт туманом».

Должностные лица OpenAI заявили, что ввиду конкурентной ситуации и последствий для безопасности крупномасштабных моделей, таких как GPT-4, он больше не раскрывает информацию об источнике своих наборов данных, и расплывчато заявили, что в основном она поступает из Интернета, социальных сетей, новостей, книг и т. д.

В документе, представляющем ChatGPT-3 в 2020 году, OpenAI, который еще не взорвался, откровенно признал, что 15% его набора обучающих данных были получены из «двух корпусов книг в Интернете». Хотя OpenAI прямо не раскрывает, что представляют собой эти наборы данных, многие осведомители утверждают, что эти наборы данных поступают из «теневой библиотеки», которая предоставляет людям бесплатные книжные материалы в нарушение авторских прав.

В феврале этого года многие СМИ обвинили OpenAI в использовании их статей для обучения без разрешения. Когда репортер Wall Street Journal запросил у ChatGPT список источников новостей, на которых он обучался, в полученном ответе было указано 20 СМИ, включая журнал, который не был авторизован. Могут ли другие генеративные ИИ, которые «всегда ходят по реке», действительно «не замочить ноги»?

Так что, в общем, трудно не вызвать у этих писателей сомнения в том, что их авторские права были нарушены.

Что еще более важно, в открытом письме также упоминается, что за последнее десятилетие или около того доход писателей упал на 40%, а текущий средний доход писателей, работающих полный рабочий день, к 2022 году составляет всего 23 000 долларов США.Вторжение ИИ может усложнить положение писателей.

Поэтому защитники также опубликовали в письме просьбу к лидерам генеративного ИИ сделать следующие три вещи.
– получить разрешение на использование наших материалов, защищенных авторским правом, и т. д. в ваших генеративных программах искусственного интеллекта;
– справедливо вознаграждать бывших и нынешних авторов, которые используют нашу работу в ваших генеративных программах искусственного интеллекта;
– справедливо компенсировать авторам, которые используют нашу работу в выводе ИИ, независимо от того, нарушает ли вывод существующий закон;

Сейчас давление оказывается на лидеров генеративного ИИ.

Вы должны знать, что многие лидеры генеративного ИИ взяли на себя более строгие «устные» обязательства по защите авторских прав публично. На слушаниях в Конгрессе США в мае этого года Альтман, «глава» OpenAI, подчеркнул, что создатели контента получат выгоду от инструментов ИИ и будут владеть и контролировать свои работы. С тех пор Альтман стал «миссионером» и путешествовал по странам мира, чтобы поддержать генеративный ИИ.

«Пощечина» пришла слишком быстро, и теперь бесконечные судебные процессы об утечке конфиденциальной информации и инциденты с нарушением авторских прав полностью положили это письмо-апелляцию на стол, и оно стало неизбежным «талисманом смерти».

Только на этот раз лидеры генеративного ИИ закрывают на это глаза?

#Добро пожаловать в официальный публичный аккаунт Айфанер в WeChat: Айфанер (идентификатор WeChat: ifanr), в ближайшее время вам будет представлен более интересный контент.

Ай Фанер | Оригинальная ссылка · Просмотреть комментарии · Sina Weibo