Генераторы изображений ИИ, похоже, пропагандируют гендерные и расовые стереотипы.

Эксперты утверждают, что популярные генераторы изображений с искусственным интеллектом, такие как Stable Diffusion , не так хорошо улавливают гендерные и культурные предубеждения при использовании алгоритмов машинного обучения для создания произведений искусства.

Многие генераторы преобразования текста в искусство позволяют вводить фразы и создавать уникальное изображение на другом конце. Тем не менее, эти генераторы часто могут быть основаны на стереотипных предубеждениях, которые могут повлиять на то, как модели машинного обучения производят изображения. Изображения часто могут быть вестернизированными или демонстрировать предпочтение определенного пола или расы, в зависимости от типов используемых фраз, отмечает Gizmodo .

В чем разница между этими двумя группами людей? Что ж, согласно Stable Diffusion, первая группа представляет «амбициозного генерального директора». а второй – «поддерживающий генеральный директор».
Я сделал простой инструмент для изучения предубеждений, укоренившихся в этой модели: https://t.co/l4lqt7rTQj pic.twitter.com/xYKA8w3N8N.

– Доктор Саша Лучони 💻🌎✨ (@SashaMTL) 31 октября 2022 г.

Саша Лучони, исследователь искусственного интеллекта из Hugging Face, создала инструмент, демонстрирующий, как смещение ИИ в генераторах преобразования текста в искусство работает в действии. Используя Stable Diffusion Explorer в качестве примера, ввод фразы «амбициозный генеральный директор» дал результаты для разных типов мужчин, а фраза «поддерживающий генеральный директор» дал результаты, которые показали как мужчин, так и женщин.

Точно так же генератор DALL-E 2 , созданный брендом OpenAI, продемонстрировал предвзятость, ориентированную на мужчин, для термина «строитель» и предвзятость, ориентированную на женщин, для термина «бортпроводник» в результатах изображения, несмотря на то, что были женщины-строители и женщины. стюардессы мужского пола.

В то время как многие генераторы изображений ИИ, кажется, просто берут несколько слов, машинное обучение и выдает изображение, в фоновом режиме происходит гораздо больше. Stable Diffusion, например, использует набор изображений LAION, в котором размещены «миллиарды картинок, фотографий и многого другого, извлеченных из Интернета, включая хостинги изображений и художественные сайты», — отмечает Gizmodo.

Расовая и культурная предвзятость при поиске изображений в Интернете уже была постоянной темой задолго до растущей популярности генераторов изображений ИИ. Лучони сообщил изданию, что такие системы, как набор данных LAION, скорее всего, найдут 90% изображений, связанных с подсказками, и используют их для генератора изображений.