Google незаметно обновился: все, что вы публикуете, будет использоваться для обучения ИИ

5 июля, 2023 Дядя Влад

В мире нет абсолютного мусора, есть только неуместные ресурсы.

В устной речи цифровых аборигенов поколения Z уже давно стало обыденным грубое определение «99% общедоступной информации в эпоху Интернета — мусор», и что интересно, мышьяк другого — это моя мед, и Google Гиганты ИИ, представленные Интернетом, начали ориентироваться на информацию, опубликованную в Интернете.

Недавно гигант поисковой системы Google обновил свою политику конфиденциальности, чтобы использовать общедоступную информацию в Интернете для обучения моделей ИИ. В политике конфиденциальности написано, что Google теперь может помочь в обучении модели искусственного интеллекта Google и создании практических функций, таких как Google Translate, Bard и Google Cloud AI, путем сбора общедоступной информации в Интернете или информации из других общедоступных источников. «Языковая модель» будет заменена на «Модель ИИ».

Согласно анализу СМИ OSCHINA, это обновление политики показывает, что Google теперь дает понять общественности и своим пользователям, что любой контент, который они публикуют публично в Интернете, может использовать Bard и его будущие версии, а также любые другие продукты искусственного интеллекта, разработанные по Гуглу. .

Системы генеративного искусственного интеллекта AIGC обычно предварительно обучаются на основе массивных данных общего назначения в Интернете, что значительно улучшает обобщение, универсальность и практичность ИИ, что неизбежно приведет к спорам об авторских правах и конфиденциальности.

На данный момент никто не может понять эту дилемму лучше, чем OpenAI.

Не так давно на OpenAI, материнскую компанию чат-робота с искусственным интеллектом ChatGPT, два американских писателя подали в федеральный суд Сан-Франциско иск, утверждая, что OpenAI не получила разрешения на авторское право и злоупотребляла их работами для обучения искусственного интеллекта.

Выставленное обвинительное заключение показывает, что обучающие данные OpenAI превышают 300 000 книг, включая спорную «Shadow Library» с неясным авторским правом (в основном бесплатные книги и документы предоставляются публике в виде онлайн-сайтов с нарушением авторских прав).

Кроме того, только вчера OpenAI объявил, что временно отключит официальный режим просмотра веб-страниц ChatGPT, что может быть связано с тем, что ChatGPT может просматривать платный доступ для получения скрытого платного контента. После судебного иска американского писателя об авторских правах, по общественному мнению, OpenAI снова оказалась глубоко вовлечена в споры об авторских правах.

Поэтому, учитывая уроки, извлеченные из судебного разбирательства с OpenAI, для Google разумно заранее обновить свою политику конфиденциальности и заранее обезопасить себя.

Хотя этот шаг эффективно снизил риск того, что Google «съест судебный процесс», он также выявил тот факт, что генеративный искусственный интеллект использует для обучения огромные сетевые данные, что неизбежно вызвало обеспокоенность общественности по поводу конфиденциальности. Иностранные СМИ Gizmodo также отметили, что это новая и интересная проблема конфиденциальности.

На самом деле, даже несмотря на то, что люди в целом понимают, что данные, публикуемые в Интернете, являются открытыми и бесплатными, существует психологическое ожидание того, что к данным могут получить доступ другие лица, но если рассматривать огромное количество данных в Интернете, как собственный задний двор интернет-гигантов искусственного интеллекта, они будут бессмысленно использовать его для обучения искусственного интеллекта, я полагаю, что многие люди будут чувствовать себя «неловко», что их личная область была нарушена из ниоткуда, поэтому они относятся к этому более осторожно .

Эта проблема беспокоит не только обычных пользователей: Илон Маск недавно объявил, что Twitter «временно ограничит» количество ежедневно читаемых пользователями твитов: непроверенные аккаунты могут видеть только 600 твитов в день, новые непроверенные аккаунты — только 300. записи можно увидеть в день. Верифицированные аккаунты ограничены 6000 постов в день.

Маск сказал, что это связано с тем, что сотни организаций (включая некоторые компании, занимающиеся искусственным интеллектом) очищают данные Twitter, чтобы они повлияли на опыт реальных пользователей.

Просто рева поезда эпохи иногда достаточно, чтобы заглушить несогласный шум пассажиров.

Если шаг Google будет законным и совместимым, а гиганты ИИ последуют их примеру, возможно, однажды мы все найдем следы нашего собственного существования в генеративном искусственном интеллекте.

#Добро пожаловать в официальный публичный аккаунт Айфанер в WeChat: Айфанер (идентификатор WeChat: ifanr), в ближайшее время вам будет представлен более интересный контент.

Ай Фанер | Оригинальная ссылка · Просмотреть комментарии · Sina Weibo