Щелчок и перетаскивание Редактирование изображений AI может изменить все

20 мая, 2023 Дядя Влад

Последней разработкой в области искусственного интеллекта является инструмент, позволяющий редактировать уже сгенерированное изображение в соответствии с вашими требованиями.

Скажем, вы хотите «изменить размеры автомобиля или превратить улыбку в хмурую с помощью простого щелчка и перетаскивания», вы можете сделать это с помощью этой модели под названием DragGAN.

Перетащите свой GAN: интерактивное манипулирование точками на коллекторе генеративного изображения
бумажная страница: https://t.co/Gjcm1smqfl pic.twitter.com/XHQIiMdYOA
– АК (@_akhaliq) 19 мая 2023 г.

Генеративно-состязательная сеть (GAN) в настоящее время находится в форме исследовательского документа, однако она привлекла такое внимание тех, кто заинтересован в просмотре ее демонстраций, что домашняя страница исследовательской группы перестала работать из-за интенсивного трафика.

The Verge сравнил DragGAN с инструментом Warp в Photoshop, добавив, что он намного мощнее, так как не «смешивает пиксели», а скорее «регенерирует базовый объект» и даже может вращать 3D-изображения.

Потенциал такого инструмента заключается в том, что ИИ, преобразующий текст в изображение, не всегда выдает то, что вам может понадобиться. Таким образом, вы можете вернуться позже и внести изменения в существующее изображение вместо автоматического создания нового изображения.

Некоторые демонстрации, которые являются частью исследовательской работы, включают в себя увеличение высоты горы, изменение положения модели и редактирование длины и формы ее одежды, открывание или закрывание пасти льва и изменение лица человека с простого на вид. улыбка. В настоящее время доступно множество инструментов искусственного интеллекта, и пользователям приходится регенерировать изображение с более конкретным запросом, чтобы получить более желаемый результат.

Исследовательская группа отметила в своем документе, что новые детали могут быть добавлены в рамках регенерации отредактированных аспектов изображений, которые полезны для обновления. «Наш подход может галлюцинировать закрытое содержимое, например, зубы во рту льва, и может деформироваться в зависимости от жесткости объекта, например, изгиба ноги лошади».

Есть много брендов, которые пытаются предложить варианты редактирования генеративного ИИ-контента. Тем не менее, большинство из них не позволяет реально редактировать изображения, а скорее разрешает такие аспекты, как редактирование изображений. Например, приложение Microsoft Designer позволяет создавать изображения AI из текстового приглашения, и вы можете выбрать наиболее понравившийся из трех результатов, а затем перенести его в студию дизайна, где вы сможете создать множество творческих и продуктивных проектов, таких как сообщения в социальных сетях, приглашения, цифровые открытки или графические изображения с изображением в качестве фокуса. Однако вы не можете редактировать изображение, созданное AI.

Пока инструмент DragGAN все еще находится в демо-версии, неизвестно, каким будет качество легкодоступной технологии и будет ли это вообще возможно, тем более что демонстрации основаны на видео с низким разрешением. Однако это интересный пример того, как быстро ИИ продолжает развиваться.