Инструмент обнаружения искусственного интеллекта Google теперь доступен каждому

23 октября, 2024 Дядя Влад

В среду Google объявил в сообщении на X (ранее Twitter) , что SynthID теперь доступен каждому, кто хочет его попробовать. Система аутентификации контента, созданного искусственным интеллектом, встраивает незаметные водяные знаки в сгенерированные изображения, видео и текст, позволяя пользователям проверять, был ли фрагмент контента создан людьми или машинами.

«Мы открываем исходный код нашего инструмента для создания водяных знаков SynthID Text», — написали в компании. «Он доступен бесплатно разработчикам и предприятиям и поможет им идентифицировать контент, созданный искусственным интеллектом».

SynthID дебютировал в 2023 году как средство нанесения водяных знаков на изображения, аудио и видео, созданные искусственным интеллектом. Первоначально он был интегрирован в Imagen, а впоследствии компания объявила о своем включении в чат-бот Gemini в мае этого года на I/O 2024.

Система работает путем кодирования токенов — это основные фрагменты данных (будь то один символ, слово или часть фразы), которые генеративный ИИ использует для понимания подсказки и прогнозирования следующего слова в ответе — с незаметными водяными знаками. в процессе генерации текста. Согласно майскому блогу DeepMind , он делает это путем «введения дополнительной информации в распределение токенов в момент их генерации путем модуляции вероятности генерации токенов».

Сравнивая выбор слов модели вместе с ее «скорректированными показателями вероятности» с ожидаемым набором оценок для текста с водяными знаками и без водяных знаков, SynthID может определить, написал ли это предложение ИИ.

Вот как SynthID наносит водяные знаки на контент, созданный искусственным интеллектом, в разных модальностях. ↓ pic.twitter.com/CVxgP3bnt2
— Google DeepMind (@GoogleDeepMind) 23 октября 2024 г.

Согласно исследованию, опубликованному в журнале Nature в среду, этот процесс не влияет на точность, качество или скорость ответа, и его невозможно легко обойти. В отличие от стандартных метаданных, которые можно легко удалить и стереть, водяной знак SynthID, как сообщается, остается, даже если контент был обрезан, отредактирован или иным образом изменен.

«Достижение надежного и незаметного нанесения водяных знаков на текст, сгенерированный искусственным интеллектом, является фундаментально сложной задачей, особенно в сценариях, где результаты [большой языковой модели] почти детерминированы, например, фактические вопросы или задачи генерации кода», — Сохейл Фейзи, доцент Университета Мэриленда. , рассказал MIT Technology Review , отметив, что его открытый исходный код «позволяет сообществу тестировать эти детекторы и оценивать их надежность в различных условиях, помогая лучше понять ограничения этих методов».

Однако система не является надежной. Несмотря на то, что SynthID защищен от взлома, водяные знаки SynthID можно удалить, если текст пропускается через приложение для языкового перевода или если он был сильно переписан. Он также менее эффективен при работе с короткими отрывками текста и при определении того, был ли ИИ сгенерирован ответ, основанный на фактическом утверждении. Например, на вопрос «Какова столица Франции?» существует только один правильный ответ. и люди, и ИИ скажут вам, что это Париж.

Если вы хотите попробовать SynthID самостоятельно, его можно загрузить с Hugging Face как часть обновленного набора инструментов Responsible GenAI от Google.