Весь Интернет теперь принадлежит искусственному интеллекту Google

Google Bard демонстрируется на Google I/O 2023.

Последнее обновление политики конфиденциальности Google сделает так, что у компании будет свободный диапазон для поиска в Интернете любого контента, который может принести пользу для создания и улучшения ее инструментов искусственного интеллекта.

«Google использует информацию для улучшения наших услуг и разработки новых продуктов, функций и технологий, которые приносят пользу нашим пользователям и обществу», — говорится в новой политике Google. «Например, мы используем общедоступную информацию, чтобы обучать модели искусственного интеллекта Google и создавать продукты и функции, такие как возможности Google Translate, Bard и Cloud AI».

Gizmodo отмечает, что политика была обновлена ​​и теперь говорит «модели ИИ», когда ранее говорилось «для языковых моделей». Кроме того, политика добавила Bard и Cloud AI, тогда как ранее упоминался только Google Translate, для которого собирались данные.

Политика конфиденциальности, которая была обновлена ​​на выходных, кажется особенно зловещей, потому что она указывает, что любая информация, которую вы предоставляете в Интернете, может быть использована Google для обучения своих моделей ИИ.

Вышеупомянутая формулировка, похоже, так или иначе описывает не только тех, кто входит в экосистему Google, но и детализирована таким образом, что бренд может иметь доступ к информации из любой части сети.

Основными проблемами, связанными с массовым развитием искусственного интеллекта, являются вопросы конфиденциальности, плагиата и того, может ли ИИ опровергать правильную информацию. Ранние версии чат-ботов, такие как ChatGPT, основаны на больших языковых моделях (LLM), в которых в качестве обучающих данных использовались уже общедоступные источники, такие как общий веб-архив сканирования, WebText2, Books1, Books2 и Wikipedia.

Ранний ChatGPT был печально известен тем, что застрял на информации после 2021 года и впоследствии заполнил ответы ложными данными. Вероятно, это может быть одной из причин, по которой Google хотел бы иметь неограниченный доступ к веб-данным для использования таких инструментов, как Bard, для обучения своих моделей ИИ в реальном мире и, возможно, в реальном времени.

Gizmodo также отметил, что Google может использовать эту новую политику для сбора старого, но все еще созданного человеком контента, такого как давно забытые обзоры или сообщения в блогах, чтобы все еще иметь представление о том, как человеческий текст и речь разрабатываются и распространяются. Тем не менее, еще неизвестно, как именно Google будет использовать собираемые данные.

Несколько платформ социальных сетей, включая Twitter и Reddit, которые являются основными источниками актуальной информации, уже ограничили свой публичный доступ из-за популярности чат-ботов с искусственным интеллектом , к огорчению всех своих сообществ.

Обе платформы закрыли бесплатный доступ к своим API, что не позволяет пользователям загружать огромное количество сообщений для публикации в других местах под предлогом защиты своей интеллектуальной собственности. Вместо этого это сломало многие сторонние инструменты, которые обеспечивают бесперебойную работу Twitter и Reddit.

И Twitter, и Reddit столкнулись с другими неудачами и спорами, поскольку опасения их владельцев по поводу захвата власти ИИ усиливаются.