Весь Интернет теперь принадлежит искусственному интеллекту Google

6 июля, 2023 Дядя Влад

Google Bard демонстрируется на Google I/O 2023.

Последнее обновление политики конфиденциальности Google сделает так, что у компании будет свободный диапазон для поиска в Интернете любого контента, который может принести пользу для создания и улучшения ее инструментов искусственного интеллекта.

«Google использует информацию для улучшения наших услуг и разработки новых продуктов, функций и технологий, которые приносят пользу нашим пользователям и обществу», — говорится в новой политике Google. «Например, мы используем общедоступную информацию, чтобы обучать модели искусственного интеллекта Google и создавать продукты и функции, такие как возможности Google Translate, Bard и Cloud AI».

Gizmodo отмечает, что политика была обновлена и теперь говорит «модели ИИ», когда ранее говорилось «для языковых моделей». Кроме того, политика добавила Bard и Cloud AI, тогда как ранее упоминался только Google Translate, для которого собирались данные.

Политика конфиденциальности, которая была обновлена на выходных, кажется особенно зловещей, потому что она указывает, что любая информация, которую вы предоставляете в Интернете, может быть использована Google для обучения своих моделей ИИ.

Вышеупомянутая формулировка, похоже, так или иначе описывает не только тех, кто входит в экосистему Google, но и детализирована таким образом, что бренд может иметь доступ к информации из любой части сети.

Основными проблемами, связанными с массовым развитием искусственного интеллекта, являются вопросы конфиденциальности, плагиата и того, может ли ИИ опровергать правильную информацию. Ранние версии чат-ботов, такие как ChatGPT, основаны на больших языковых моделях (LLM), в которых в качестве обучающих данных использовались уже общедоступные источники, такие как общий веб-архив сканирования, WebText2, Books1, Books2 и Wikipedia.

Ранний ChatGPT был печально известен тем, что застрял на информации после 2021 года и впоследствии заполнил ответы ложными данными. Вероятно, это может быть одной из причин, по которой Google хотел бы иметь неограниченный доступ к веб-данным для использования таких инструментов, как Bard, для обучения своих моделей ИИ в реальном мире и, возможно, в реальном времени.

Gizmodo также отметил, что Google может использовать эту новую политику для сбора старого, но все еще созданного человеком контента, такого как давно забытые обзоры или сообщения в блогах, чтобы все еще иметь представление о том, как человеческий текст и речь разрабатываются и распространяются. Тем не менее, еще неизвестно, как именно Google будет использовать собираемые данные.

Несколько платформ социальных сетей, включая Twitter и Reddit, которые являются основными источниками актуальной информации, уже ограничили свой публичный доступ из-за популярности чат-ботов с искусственным интеллектом , к огорчению всех своих сообществ.

Обе платформы закрыли бесплатный доступ к своим API, что не позволяет пользователям загружать огромное количество сообщений для публикации в других местах под предлогом защиты своей интеллектуальной собственности. Вместо этого это сломало многие сторонние инструменты, которые обеспечивают бесперебойную работу Twitter и Reddit.

И Twitter, и Reddit столкнулись с другими неудачами и спорами, поскольку опасения их владельцев по поводу захвата власти ИИ усиливаются.