Не паникуйте, рисование ИИ не может убить искусство

Один день рисования ИИ равен одному земному году.

Dall-E 2 и Midjourney, ставшие популярными в первой половине года, во второй половине года были полностью вытеснены Stable Diffusion.

Все недавние продукты горячего волочения имеют в своих названиях слово «диффузия», и все они используют алгоритм «диффузии» искусственного интеллекта. Этот алгоритм преодолевает критическую точку приложения рисования ИИ, который проще в использовании и лучше действует.

Машинная живопись имеет полувековую историю, и за два года ИИ-живопись внезапно превратилась в «атакующего гиганта».Не только улучшилось качество, видимое невооруженным глазом, но и скорость генерации картинок сократилась с нескольких часов в начале года до более десяти секунд звонка.

Значительные достижения в технологии рисования ИИ вызвали интерес к «творческому ИИ» — ряду инструментов ИИ, которые имитируют человеческое творчество, от изобразительного искусства до поэзии. Но паники особо никто не чувствовал.

Некоторое время назад многие предполагали, что Ян Нин, биолог, покинул Соединенные Штаты и вернулся в Китай, потому что система искусственного интеллекта AlphaFold могла предсказывать структуру белков, и его лишили работы. На самом деле программное обеспечение, которое может писать новостную информацию, существует уже давно, и ни один журналист из-за него не потерял работу. ИИ не может заменить даже людей, которые пишут кубики тофу, не говоря уже о ведущих ученых.

Что такое алгоритм диффузии

Текущие модели искусственного интеллекта используют нейронные сети с глубоким обучением. Самообучающиеся модели, такие как GPT-3, являются наиболее известными из этих моделей, которые будут «обучать» в нейронной сети около 45 ТБ текстовых данных и генерировать работы, почти такие же, как и человеческий вывод.

Stable Diffusion является частью семьи глубокого обучения. В частности, Stable Diffusion изучает связь между изображениями и текстом с помощью модели скрытой диффузии. Он работает, беря данные изображения и добавляя к ним «шум». Шум, также называемый шумом, относится к грубым пятнам на изображениях, снятых цифровым фотооборудованием, которые обычно создаются электронными помехами.

К изображению постепенно добавляется шум, пока все изображение не станет белым шумом. Модель записывает этот процесс и обращает его для обучения ИИ.

С точки зрения ИИ первое, что вы видите, — это изображение, полное шума, затем вы видите, что изображение становится более четким, и, наконец, оно становится картиной. Что ИИ изучает, так это весь процесс шумоподавления, особенно то, как бороться с гауссовым шумом и, наконец, генерировать картины.

Гауссовский шум относится к типу шума, функция плотности вероятности которого подчиняется распределению Гаусса (то есть нормальному распределению).Алгоритм диффузии добавляет гауссовский шум.Один из них заключается в проверке достоверности «фактического» изображения, поскольку изображения в среде использования все шумные.Один для удобства обучения, пока шум не соответствует стандартному нормальному распределению, он будет недействительным.

Базовая база данных Stable Diffusion называется LAION-Aesthetics и содержит изображения с иллюстрациями, а также отфильтрована по «эстетическому стилю». Другие обученные модели искусственного интеллекта также «исправляли» базу данных, чтобы предсказать, как люди будут реагировать на рейтинги «насколько вам нравится эта картина», чтобы удалить часть порнографического контента.

Чем он отличается от «предшественников»

Stable Diffusion похож на Dall-E 2 и Midjourney тем, что он использует «текстовое описание» для создания изображений.

Однако Stable Diffusion имеет открытый исходный код, и его базовый код общедоступен. Ни Open AI, ни Google не выпускали собственных моделей AI.

Стабильность ИИ состоит из более чем 4000 графических процессоров NVIDIA A100, работающих в облаке Amazon (AWS). Согласно отчетам, операционные и облачные расходы Stability AI превышают 50 миллионов долларов.

Компания утверждает, что может обеспечить «прорыв в скорости и качестве», и что графические процессоры с объемом памяти менее 10 ГБ также могут работать. Они также предоставят версии, работающие на чипах AMD, Apple M1/M2.

В настоящее время функция Stable Diffusion заключается в том, что он может преобразовывать текст в изображение размером 512×512 пикселей за несколько секунд; изображение можно преобразовывать, увеличивать, изменять и заменять; используя моделирование GFP-GAN, что позволяет пользователям загружать размытые изображения лица. для увеличения или восстановления исходного вида.

В прошлом месяце Stability AI привлекла 101 миллион долларов. Генеральный директор Эмад Мостак окончил Оксфордский университет со степенью магистра математики и информатики, ранее работал аналитиком в различных хедж-фондах. В настоящее время компания оценивается в $1 млрд. Помимо Stable Diffusion, существует еще и Dance Diffusion — монтаж музыки.

План заработка Stability AI заключается в обучении «частных» моделей и инфраструктурных платформ общего назначения для клиентов. У него есть платформа DreamStudio, которая также доступна для отдельных пользователей. Сегодня у DreamStudio более 1,5 миллиона пользователей, которые создали около 200 миллионов изображений. С учетом всех каналов у Stable Diffusion более 10 миллионов пользователей.

Компания также наняла известного ученого Google и футуролога Дэниела Джеффриса.

Это искусство?

С появлением различных видов искусственного интеллекта также обостряются связанные с этим этические и юридические вопросы. Стабильная диффузия позволяет генерировать реальные изображения, и проблема становится более «серьезной».

Пользователи использовали Stable Diffusion для создания большого количества деликатного контента, а поддельные фотографии знаменитостей летают повсюду. Getty Images запретила загрузку изображений, созданных Stable Diffusion, из-за проблем с интеллектуальной собственностью.

Член Палаты представителей США Анна Г. Эшооо недавно опубликовала письмо, призывающее советника по национальной безопасности США и Управление по научно-технической политике заняться этими «небезопасными моделями».

В объявлении о выпуске Stability AI объявила о «свободной лицензии, позволяющей коммерческое и некоммерческое использование», что на самом деле является соглашением с пользователями. Он ожидает, что пользователи будут самостоятельно регулировать свое поведение и делать «правильные вещи», и малоэффективен для наказания пользователей, которые не следуют правилам.

Помимо юридических вопросов, под подозрение попадают и произведения, созданные искусственным интеллектом.

Во всяком случае, Бюро регистрации авторских прав США считает эти изображения «не искусством». В феврале комиссия по рассмотрению авторских прав отклонила заявки на изображения, созданные искусственным интеллектом.

Наблюдательный совет подчеркнул, что «человеческое авторство является предпосылкой для защиты авторских прав» и требует «отношения между человеческой мыслью и творческим выражением». Федеральный суд США также в недавнем решении постановил, что искусственный интеллект не может считаться «изобретателем» патента.

Искусство искусственного интеллекта очень привлекательно, оно хоть и не признано юридически, но признано рынком. В 2018 году Christie’s продал картину с искусственным интеллектом за 435 000 долларов. Более того, подавляющее большинство потребителей не может отличить картины ИИ от работ художников-людей.

Самым спорным является художественный конкурс на Ярмарке штата Колорадо в сентябре этого года. Работа с искусственным интеллектом «Théâtre D'Opera Spatial» получила первый приз. Она была произведена Midjourney, а оператор Джейсон Аллен сказал: «Искусство мертво, ИИ выигрывает, люди проигрывают».

На самом деле, не нужно обобщать, в создании искусственного интеллекта не нужно быть чрезмерно оптимистичным или преувеличенно пессимистичным.

Художественное творение искусственного интеллекта производится по «логике» людей, конечно, не так хорошо, как человеческие элиты, но более чем достаточно, чтобы превзойти посредственность среди них.

#Добро пожаловать, обратите внимание на официальный публичный аккаунт Айфанер в WeChat: Айфанер (идентификатор WeChat: ifanr), более интересный контент будет представлен вам как можно скорее.

Ай Фанер | Оригинальная ссылка · Просмотреть комментарии · Sina Weibo