Исследователи используют А.И. делать улыбающиеся фотографии домашних животных — и это так жутко, как кажется

nvidia ganimal ai исследование
NVIDIA Research

Не можете заставить свою собаку или этого тигра в зоопарке улыбаться для своего Instagram? Новая искусственно интеллектуальная программа, разработанная исследователями из Nvidia, может взять выражение одного животного и поместить его на фотографию другого животного. Называется GANimal — после генеративных состязательных сетей, тип AI — программное обеспечение позволяет пользователям загружать изображение одного животного, чтобы воссоздать выражение питомца и позировать на другом животном.

Программы GAN предназначены для преобразования одного изображения в другое, но обычно ориентированы на более узкие задачи, такие как превращение лошадей в зебр. GANimal, однако, применяет несколько различных изменений к изображению, корректируя выражение, положение головы животного и, во многих случаях, даже фон, от вдохновляющего изображения до исходного изображения. В отличие от большинства GAN, программа предназначена для работы с любым животным.

Насколько хорошо это работает, однако, подлежит обсуждению. Одно из образцов изображений, которыми поделились исследователи, делает мопса больше похожим на мастифа, а лиса больше похожа на рысь. Хотя некоторые из образцов изображений выглядят довольно жутко, исследование может иметь важные последствия для будущих исследований ИИ.

Как объясняет Nvidia, предыдущим программам для работы требовалось несколько изображений целевого животного, а новой программе — только одно. Исследователи называют эту вариацию FUNIT — алгоритм «малоизвестной трансляции изображения в изображение». Цель, или животное, к которому нужно добавить новое выражение, указывается с помощью небольшого количества изображений вместо массового числа, которое обычно требуется для обучения программ искусственного интеллекта.

Программа научилась смешивать эти выражения с новым животным так же, как многие люди учатся — практиковаться. «В этом случае мы обучаем сеть совместному решению многих задач по переводу, где каждая задача заключается в переводе случайного исходного животного в случайное целевое животное, используя несколько примеров изображений целевого животного», — сказал Минг-Ю Лю, один из ведущие исследователи проекта. «Благодаря практике решения различных задач перевода, в конечном итоге сеть учится обобщать, чтобы переводить известных животных ранее невидимым животным».

По словам Нвидии, эта работа может привести к реальному использованию с дополнительными исследованиями, включая создание фильмов с живыми действиями с использованием легко обучаемых собак, а затем с помощью ИИ, чтобы превратить этих собак в тигров. Но эта работа также является неотъемлемой частью цели исследователя Лю — использовать нейронные сети, чтобы придать программному обеспечению «воображение», более человечное.

Программа доступна для того, чтобы опробовать свои собственные фотографии на игровой площадке Nvidia AI .